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Geleitwort 

Mit zunehmender Steigerung der Prozessorleistungen gewinnt die optimierende 
Planung zur Losung betriebswirtschaftlicher Entscheidungsprobleme wieder an 
Bedeutung. Die beachtliche numerische Verarbeitungskapazitat der heute schon 
verfiigbaren Workstations gibt Anlafi zu der Erwartung, dafi wichtige betriebliche 
Planungsaufgaben mit dem Verfahren der "Linearen Programmierung" gelost wer- 
den konnen. Diese giinstige Prognose gilt jedoch nicht fiir jene Planungsprobleme, 
die sowohl kontinuierlich variierende Entscheidungsgrofien als auch ganzzahlige 
Variablen erfordern. Derartige Planungsverfahren auf der Grundlage gemischt- 
ganzzahliger Modelle fiihren wegen der Ganzzahligkeitsforderung auf Probleme der 
kombinatorischen Optimierung. In diesem Zusammenhang steigt der Rechenauf- 
wand mit zunehmender ModellgroEe exponentiell an. Mit herkommlichen Rechner- 
architekturen lassen sich derartige Probleme bei einem vertretbaren Rechenaufwand 
nicht mehr losen. 

Wegen der typischen Eignung kombinatorischer Aufgaben fiir die Parallelverarbei- 
tung bietet es sich an, parallele Rechnerarchitekturen einzusetzen. In der vorliegen- 
den Schrift werden erstmals mit der gebotenen Systematik parallele Verfahren der 
kombinatorischen Optimierung am Beispiel der Produktions- und Ablaufplanung 
untersucht. Zugleich werden Berechnungsverfahren zum Zeitverhalten paralleler 
Rechnerarchitekturen angegeben, wobei schliefilich das Kosten-Leistungsverhaltnis 
als Grundlage fiir eine vergleichende okonomische Bewertung der Parallelverarbei- 
tung herangezogen wird. 

Die Verfasserin hat mit ihrer Arbeit in eindrucksvoller Weise die Nutzung paralleler 
Rechnerarchitekturen im Rahmen der betriebswirtschaftlichen Planung erschlossen 
und damit den Weg fiir weitere Forschungsarbeiten aufgezeigt. 



Prof. Dr. D.B. PreEmar 
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1. Einleitung 

Als Folge der zunehmenden Komplexitat des Unternehmensgeschehens und des 
wachsenden Bestrebens der Unternehmungen, die Produktivitat und die Wirtschaft- 
lichkeit der ablaufenden Betriebsprozesse zu erhohen, steigt die Notwendigkeit, 
Entscheidungen nicht spontan, sondern auf der Grundlage einer alle Handlungs- 
alternativen abwagenden, an den Unternehmenszielen ausgerichteten Planung zu 
treffen. 1 Diese Erkenntnis setzte sich in der Betriebswirtschaftslehre schon sehr friih 
durch und fiihrte dazu, dafi bereits in den 50er und 60er Jahren eine Vielzahl von 
linearen und gemischt-ganzzahligen Modellen zur Abbildung der in der betriebli- 
chen Praxis anstehenden Planungsprobleme formuliert wurden. 2 

Obwohl fast zeitgleich zur Entwicklung der Modelle auch die Entwicklung von 
Algorithmen zu deren Losung vorangetrieben wurde, konnten zunachst nur kleine 
akademische Falle behandelt werden, da zum einen Beschrankungen der Rechenan- 
lagen und zum anderen bei der Berechnung auftretende Rundungsfehler, die zu 
falschen Ergebnissen oder dem Abbruch des Rechenverfahrens fuhrten, die Bearbei- 
tung von Problemen praxisrelevanter Grofienordnungen unmoglich machten. 3 

Die schnelle Entwicklung in der Computertechnik und die intensive Forschung zur 
Verbesserung der Algorithmen 4 fuhrten dazu, dafi eine Vielzahl von Standard-Soft- 
ware-Paketen entstanden, die Moglichkeiten eroffneten, Probleme mit einigen 



1 Adam, D.: Kurzlehrbuch Planung, 2. Aufl., Wiesbaden 1983, S. 11 

2 Vgl. hierzu z.B.: Dinkelbach, W., Hax, H.: Die Anwendung der gemischt-ganzzahligen linearen 
Programmierung auf betriebswirtschaftliche Entscheidungsprobleme, Zeitschrift fur handels- 
wissenschaftliche Forschung, 14. Jg., 1962, S. 179-196; Dinkelbach, W., Steffens, F.: Gemischt 
ganzzahlige Programme zur Losung gewisser Entscheidungsprobleme, Untemehmensfor- 
schung, Bd. 5, 1961, S. 3-14 

3 Vgl. hierzu z.B.: Brauer, K.M.: Binare Optimierung, Koln Berlin 1969, S. 15; Kilger, W.: Optimale 
Produktions- und Ablaufplanung, Opladen 1973, S. 10 

4 Einen Uberblick fiber die in der Literatur veroffentlichten Mafinahmen zur Verbesserung der 
Algorithmen fur den Bereich der linearen Optimierung bis 1980 gibt BASTIAN. Vgl. hierzu: 
Bastian, M.: Lineare Optimierung grofier Systeme, Konigstein/Ts. 1980. Fiir den Bereich der 
gemischt-ganzzahligen Optimierung findet sich eine Zusammenfassung in: Forrest, J.J.H., Hirst, 
J.P.H., Tomlin, J.A.: Practical Solution of Large Mixed Integer Programming Problems with 
UMPIRE, Management Science, Vol. 20, Nr. 5, 1974, S. 736-773 
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tausend Restriktionen zu losen . 5 Damit konnte sich der Einsatz linearer Planungs- 
modelle zunachst in der Praxis immer mehr durchsetzen 6 . 

Da jedoch aufgrund der erweiterten Moglichkeiten die Modellierer eine immer 
genauere Abbildung der Realitat vornahmen 7 , entstanden zumeist gemischt-ganz- 
zahlige Modelle, fur deren Losung selbst die deutlich gestiegenen Leistungen der 
Optimierungsverfahren immer noch nicht ausreichend waren, so dafi auch weiterhin 
nach Verbesserungen der bestehenden sowie nach neuen Losungsmoglichkeiten 
gesucht werden mufite. 

Hierbei wurden im wesentlichen drei Richtungen verfolgt: 

- alternative Modellformulierungen 

- Entwicklung neuer Algorithmen 

- Verbesserung bestehender Algorithmen 

Beziiglich der Modellformulierung wurde erkannt, dafi sie fur den Bereich gemischt- 
ganzzahliger Modelle i.a. einen entscheidenden EinfluP auf das Losungsverhalten 
besitzt . 8 Ferner haben gerade die Modelle, die in der betrieblichen Praxis entstan- 
den sind, gezeigt, dafi im Laufe des Entwicklungsprozesses eines Modells u.U. eine 
Reihe von Nebenbedingungen entstehen, die redundant sind oder aber vereinfacht 
werden konnen. In diesem Zusammenhang wurde das sogenannte Preprocessing 
eingefuhrt, das vor der eigentlichen Optimierung zunachst eine entsprechende 
Uberarbeitung des Modells vornimmt . 9 



5 Ein Uberblick iiber in den 70er Jahren bestehende Systeme findet sich in: Land, A.H., Powell, S.: 
Computer codes for problems of Integer Programming, Annals of Discrete Mathematics, Vol. 5, 
1979, S. 221-269 

6 Steinicke, V., Seifert, O., Ohse, D.: Lineare Planungsmodelle im praktischen Einsatz, Frank- 
furt/Main 1973 

7 In der betriebswirtschaftlichen Literatur findet sich dieser Trend schon in den 60er Jahren durch 
die Entwicklung von Simultanmodellen, die moglichst viele Teilbereiche zu erfassen suchen, um 
so die zwischen den einzelnen Teilbereichen bestehenden Interdependenzen beriicksichtigen zu 
konnen. 

8 Suhl, U.: Entwicklungstendenzen von mathematischer Optimierungs-Software, IBM Kongress 
'86, IBM Deutschland 1986, S. 13 f; Spielberg, K.: Entwicklungstendenzen in der Mathematischen 
Programmierung, IBM Kongress '88, IBM Deutschland 1988, S. 1 

9 Brearley, A., Mitra, G., Williams, H.P.: Analysis of mathematical programming problems prior 
to applying the simplex method, Mathematical Programming, Vol. 8, 1975, S. 54-83; Guignard, 
M., Spielberg, K.: Logical Reduction Methods in Zero-One Programming (Minimal Preferred 
Variables), Operations Research, Vol. 29, Nr. 1, 1981, S. 49-74; Johnson, E.L., Kostreva, M.M., 
Suhl, U.H.: Solving 0-1 Integer Programming Problems arising from Large Scale Planning 
Models, Operations Research, Vol. 33, Nr. 4, 1985, S. 803-819; Suhl, U.H.: Solving Large-Scale 
Mixed-Integer Programs with Fixed-Charge Variables, Mathematical Programming, Vol. 32, 
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Neue Algorithmen wurden zumeist fur spezielle Problemstellungen entwickelt oder 
weisen, wie z.B. die Lagrange-Relaxation 10 , Einschrankungen beziiglich der 
Anwendbarkeit auf, die letztendlich auch wieder dazu fiihren, dafi nur spezielle 
Problemstellungen behandelt werden konnen. Mit dem Verfahren von Karmarkar 11 
wurde 1984 allerdings auch ein neuer Algorithmus zur Losung allgemeiner LP- 
Probleme entwickelt. Obwohl seine Laufzeit im Gegensatz zur bisher eingesetzten 
Simplex-Methode polynomial beschrankt ist, konnte er sich bisher nicht allgemein 
durchsetzen, da sich haufig die auf dem Simplexverfahren basierenden Implemen- 
tationen als schneller erwiesen haben. 12 

Verbesser ungen bestehender Algorithmen zur Losung allgemeiner Optimierungs- 
probleme wurden primar fiir den Bereich der linearen Optimierung erreicht. 13 Sie 
fiihrten dazu, dafi heutzutage lineare Optimierungsmodelle mit mehreren tausend 
Nebenbedingungen in vertretbarer Zeit gelost werden konnen. 14 Obwohl sich diese 
Verbesserungen auch auf die gemischt-ganzzahlige Optimierung auswirken, so daE 
jetzt Probleme bewaltigt werden konnen, an deren Losung friiher noch gar nicht 
gedacht werden konnte, kann dieser Bereich immer noch nicht als zufriedenstellend 
angesehen werden. Dieses zeigt sich besonders deutlich bei der Produktionspla- 
nung. Hier werden grofitenteils noch Heuristiken zur Losung der anstehenden 
Planungsprobleme eingesetzt. Es besteht demnach auch weiterhin die Notwendig- 
keit, iiber neue Losungsmoglichkeiten gemischt-ganzzahliger Optimierungsmodelle 
nachzudenken. 

Da schon, wie bisher aufgezeigt worden ist, eine Vielzahl von Anstrengungen hin- 
sichtlich der Modellformulierung und der Algorithmen unternommen worden sind. 



1985, S. 165-182; Martin, R.K., Schrage, L.: Subset Coefficient Reduction Cuts for 0/1 Mixed- 
Integer Programming, Operations Research, Vol. 33, Nr. 3, 1985, S. 505-526; Van Roy, T.J., 
Wolsey, L.A.: Solving Mixed Integer Programming Problems Using Automatic Reformulation, 
Operations Research, Vol. 35, Nr. 1, 1987, S. 45-57 

10 Ein Uberblick fiber die Ansatze bis etwa 1980 findet sich in: Fisher, M.L.: The Lagrangian Rela- 
xation Method For Solving Integer Programming Problems, Management Science, Vol. 27, Nr. 1, 
1981, S. 1-18 

Karmarkar, N.: A New Polynomial Time Algorithm for Linear Programming, Combinatorica, 
Vol. 4, 1984, S. 373-395 

1 2 Suhl, U.: Entwicklungstendenzen von mathematischer Optimierungs-Software, a.a.O., S. 11 

1 3 Suhl, U.H., Aittoniemi, L.: Computing Sparse LU-Factorizations for Large Scale Linear Pro- 
gramming Bases, Arbeitspapier Nr. 58/87, FU Berlin Fachbereich Wirtschaftswissenschaften 
1987; Suhl, U.H.: Design and Implementation of a fast and portable LP-Optimizer, Operations 
Research Proceedings 1988, Berlin Heidelberg 1989, S. 165-173 

1 4 So konnen z.B. von MPSX/370 Version 2 bis zu 32766 Nebenbedingungen verarbeitet werden. 
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soil in der vorliegenden Arbeit schwerpunktmafiig ein anderer Weg beschritten 
werden, um die gewiinschten Geschwindigkeitssteigerungen zu erzielen. 

Auf der einen Seite sind fur die Berechnung extrem rechenintensiver Aufgaben 
sogenannte Supercomputer 15 als Number Cruncher entwickelt worden. Wahrend 
der erste Rechner dieser Art, die 1976 auf den Markt gebrachte CRAY-1, zunachst 
nur einen gegeniiber konventionellen Grofirechnern sehr leistungsfahigen Vektor- 
prozessor besafi, dessen Hochstleistung bei 160 Megaflops lag, werden heutzutage 
zwei Richtungen verfolgt, um Leistungen zu erzielen, die bis in den Gigaflop- 
Bereich reichen und demnachst in den Teraflop-Bereich vorstofien werden 16 ' 17 . 
Einerseits wird die Zahl der Vektorprozessoren sowie deren Leistungsfahigkeit 
immer weiter erhoht. Der Ende 1991 von CRAY angekiindigte Vektor-Supercompu- 
ter 18 , die CRAY Y-MP90, weist z.B. schon 16 Prozessoren auf. Andererseits werden 
jedoch auch verstarkt Supercomputer entwickelt, die aus mehreren hundert weniger 
leistungsstarken, dafiir aber kostengiinstigeren Prozessoren bestehen. Beispiele 
hierfiir sind das 1000-Prozessor system Par sy tec GCel, der Rechner CM-5 von 
Thinking Machine mit 1024 Prozessoren oder aber Intels System Paragon™ XP/S mit 
maximal 4000 Prozessoren. 

Auf der anderen Seite werden aufgrund der schnell fortschreitenden Entwicklung 
im PC- 19 und Workstation 20 -Bereich, die zu erheblichen Leistungssteigerungen bei 
gleichzeitiger Kostendegression gefiihrt hat, in den Unternehmen immer mehr 
Applikationen von Grofirechnern und Anlagen der mittleren Datentechnik auf PC- 



15 Als Supercomputer werden allgemein die jeweils zu einem Betrachtungszeitpunkt schnellsten 
Rechner bezeichnet. 

16 1 Megaflop (Mflop) = 10 6 Gleitkommaoperationen pro Sekunde, 1 Gigaflop (Gflop) = 10 9 Gleit- 
kommaoperationen pro Sekunde, 1 Teraflop (Tflop) = 10 12 Gleitkommaoperationen pro Se- 
kunde 

12 Mierzowski, K.: Vektorrechner liegen noch vom im Supercomputer-Markt, VDI nachrichten. Nr. 
33, 14. August 1992, S. 10 

18 Ein Vektor-Supercomputer ist ein speziell fur die schnelle Verarbeitung von Vektoren entwickel- 
ter Rechner. Das hierbei verfolgte Flieflbandprinzip wird im dritten Kapitel noch naher erlautert. 

19 PC = Personal Computer; es handelt sich hierbei um einen auf die Anforderung eines Einzelbe- 
nutzers ausgerichteten Computer, bei dem der Benutzer frei liber dessen Lei stung verfiigen 
kann. Eingesetzt werden Personal Computer fur vielfaltige Aufgaben im Biiro sowie im wissen- 
schaftlichen und technischen Bereich. Vgl. Muller, P., Lobel, G., Schmid, H.: Lexikon der Daten- 
verarbeitung, 8. Siemens-interne Aufl., Berlin Miinchen 1992, S. 493 f 

2 ^ Als Workstation wird eine Datenstation an einem Arbeitsplatz bezeichnet, die zum einen 
Da ten verarbeitung "vor Ort" ermoglicht und zum anderen in der Regel fiber ein Netz Zugang zu 
zentralen Funktionen hat, die von einem sogenannten Server bereitgestellt werden. Vgl. Muller, 
P., Lobel, G., Schmid, H.: a.a.O., S. 47 und 172 
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oder Workstation-LANs 21 ausgelagert, weil diese mittlerweile in vielen Bereichen 
die gleiche Leistung wie ein Grofirechner erzielen, jedoch ein deutlich besseres Preis- 
Leistungs-Verhaltnis aufweisen 22 ' 23 

Da fruher jedoch hauptsachlich Grofirechner aufgrund des hohen Speicherplatzbe- 
darfs und der benotigten Rechenleistung fiir die Optimierung eingesetzt wurden, 
sind die Entwickler von Standard-Software-Paketen zur linearen und gemischt- 
ganzzahligen Optimierung gezwungen, sich der veranderten DV-Landschaft anzu- 
passen. 

So wurden nach der Einfiihrung des PCs sehr schnell auch Softwaresysteme zur 
linearen Optimierung fiir den PC-Bereich entwickelt, allerdings zumeist nur zur 
Losung des kontinuierlichen Optimierungsproblems. Wegen ihres geringen 
Leistungsumfangs, bedingt durch die Einschrankung der zunachst noch geringen 
Rechenleistung der PCs und dem geringen zur Verfiigung stehenden Speicherplatz, 
wurden diese Systeme zumeist im akademischen Bereich eingesetzt. Mit der fort- 
schreitenden Entwicklung stehen jetzt allerdings auch im PC-Bereich sehr leistungs- 
fahige LP-Pakete zur Verfiigung, die zunehmend die gemischt-ganzzahlige Optimie- 
rung umfassen. 24 Im Bereich der kontinuierlichen Optimierung konnen hiermit 
schon Modelle mit iiber 2000 Variablen und 1000 Nebenbedingungen problemlos 
bearbeitet werden. 25 Mit dem Einzug von Workstations in den nicht technisch- 
naturwissenschaftlichen Bereich werden die LP-Pakete zumeist auch fiir Worksta- 
tions angeboten. 

Auf Supercomputern lassen sich nur dann vertretbare Leistungen erzielen, wenn 
eine Anpassung der Software an die gegebene Hardware vorgenommen wird. 
Dieses wurde fiir den Bereich der Vektor-Supercomputer auch durchgefiihrt. Bei 
den ersten Vektor-Supercomputern ergaben sich hierbei allerdings Probleme, da die 



21 LAN = Local Area Network; bei einem lokalen Netz handelt es sich um ein privates Netz, das 
innerhalb eines ortlich begrenzten Bereichs, z.B. eines Biirogebaudes, dem Datenaustausch zwi- 
schen den an dieses Netz angeschlossenen Einrichtungen, wie z.B. PCs und Workstations, dient. 
Vgl. Muller, P., Lobel, G., Schmid, H.: a.a.O., S. 370 

22 Teetz, M.: Client Server-Computing, Mainframe-Denken obsolet, Personal Computer, Nr. 9, Sep- 
tember 1992, S. 96-99, hier S. 96 

23 ohne Autor: Kostendruck verandert die vorhandene DV-Landschaft, PC magazin, Nr. 34, 19. 
August 1992, S. 41-43, hier S. 43 

24 Beispiele sind CPLEX 2.0 von CPLEX Optimization, Inc., XPRESS-MP von Dash Associates Ltd., 
MPSIII von Ketron Management Science, Inc. oder OSL von IBM. 

23 Ashford, R.W., Daniel, R.C.: Some Lessons in Solving Practical Integer Programs, Journal of the 
Operational Research Society, Vol. 43, Nr. 5, 1992, S. 425-433 
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bisher verwendete indirekte Adressierung durch die Vektorprozessoren nicht sehr 
effizient bearbeitet werden konnte und damit die Geschwindigkeitsvorteile derarti- 
ger Rechner fiir die lineare Optimierung nicht genutzt werden konnten. Mit der 
Entwicklung neuer Vektorprozessoren konnten jedoch auf diesem Gebiet wesentli- 
che Fortschritte erzielt werden, so dafi in Verbindung mit entsprechenden Anpas- 
sungsmafinahmen an die veranderte Hardware kommerzielle LP-Pakete auch auf 
Vektor-Supercomputern relativ effizient arbeiten . 26 

Fiir massiv parallele Systeme 27 dagegen finden sich zwar in der Literatur eine Reihe 
von Implementationen von Branch-and-Bound-Algorithmen, allerdings wurden 
hierbei zumeist nur an spezielle Probleme angepafite Branch-and-Bound-Algorith- 
men, wie z.B. fiir das Rundreiseproblem, untersucht. 

Im Rahmen der vorliegenden Arbeit wurden daher Parallelisierungsansatze fiir 
einen Branch-and-Bound-Algorithmus zur Losung allgemeiner gemischt-ganzzahli- 
ger Optimierungsprobleme entwickelt. Da zum einen zunachst kein massiv paralle- 
ls System zur Verfiigung stand und zum anderen die heute bestehende DV-Land- 
schaft eine immer starkere Tendenz zum Einsatz vernetzter Arbeitsplatzrechner 
aufweist, wurde zunachst eine Implementation auf einem PC-LAN vorgenommen. 
Spater bestand die Moglichkeit, eine Implementation auch auf einem massiv paralle- 
len System, und zwar dem SUPRENUM-Rechner, durchzufuhren. Des weiteren 
konnten erste Erfahr ungen mit einer Implementation auf einem Works tation-L AN 
gesammelt werden. 

Da beziiglich aller zur Verfiigung stehenden Komponenten zum Zeitpunkt der 
Implementation noch erhebliche Einschrankungen bestanden und z.T. auch noch 
bestehen, darf die vorliegende Arbeit nicht als ein Versuch gesehen werden, ein 
kommerzielles Produkt zu erstellen, sondern soil anhand der durchgefiihrten 
Implementationen Vor- und Nachteile moglicher Parallelisierungsvarianten aufzei- 
gen, auf Probleme bei der parallelen Verarbeitung hinweisen sowie eine Abschat- 
zung des Kosten-Leistungsverhaltnisses auf verschiedenen, die Parallelverarbeitung 
unterstutzenden Systemen ermoglichen. 

Als konkrete Problemstellung wurde die Produktionsplanung gewahlt, da fiir sie 
eine Reihe von gemischt-ganzzahligen Modellen existieren, die haufig noch nicht mit 



2 ^ Forrest, Tomlin, J.A.: Vector Processing in Simplex and Interior Methods for Linear Pro- 

gramming, IBM Almaden Research Center, San Jose, CA 95120, 1988 

27 Massiv parallele Systeme weisen eine sehr hohe Anzahl von Prozessoren auf, die unabhangig 
voneinander die verschiedensten Aufgaben ausfiihren konnen. Im Kapitel 3 wird hierauf 
ausfiihrlich eingegangen. 
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vertretbarem Aufwand durch den Einsatz von optimierenden Verfahren gelost 
werden konnen. In der Praxis werden dann in diesem Fall entweder Heuristiken zu 
deren Losung herangezogen oder aber es wird versucht, durch eine starke Vereinfa- 
chung des Problems, wie z.B. eine Aggregation von Produkten oder Maschinen, die 
Losbarkeit herbeizufiihren. Eine Beschreibung des in der vorliegenden Arbeit kon- 
kret gewahlten Produktionsplanungsmodells erfolgt im zweiten Kapitel. Hierbei 
werden auch Modellierungsmafinahmen vorgestellt, von denen erwartet wird, dafi 
sie einen positiven EinfluB auf das Losungsverhalten ausiiben. 

Im dritten Kapitel werden zunachst Aspekte der Parallelverarbeitung aufgezeigt. 
Anschliefiend erfolgt ein Uberblick iiber die Einfiihrung des Parallelismus in die 
Hardware und iiber die Architektur heute bestehender Parallelrechner. Als letztes 
wird eine allgemeine Leistungsbetrachtung von Parallelrechnern vorgenommen 
sowie mogliche Ursachen fiir den zumeist nur degressiven Leistungsanstieg mit 
zunehmender Prozessorzahl vorgestellt. 

Nachdem im zweiten Kapitel u.a. verschiedene Moglichkeiten erlautert worden 
sind, durch die Modellformulierung die Komplexitat des Produktionsplanungspro- 
blems zu reduzieren, werden im Kapitel 4 fiir die sequentielle Verarbeitung mehrere 
Verfahrensvarianten eines Branch-and-Bound-Algorithmus vorgestellt. Des weiteren 
erfolgt eine detaillierte Betrachtung des Ablaufs sowie eine theoretische Beurteilung 
der unterschiedlichen Varianten im Hinblick auf das Losungsverhalten. 

Im fiinften Kapitel werden dann zunachst mogliche Parallelisierungsvarianten auf- 
gezeigt, bevor eine Beschreibung der in der vorliegenden Arbeit untersuchten Vari- 
anten erfolgt. Anschlieliend werden die Probleme, die sich bei der Ubertragung der 
sequentiellen auf die parallele Verarbeitung ergeben, angesprochen und verschie- 
dene Losungsvorschlage diskutiert. 

Genau wie bei den sequentiellen Verfahrensvarianten werden auch hier die 
verschiedenen Varianten beurteilt. Hierbei sind jedoch weniger die absoluten 
Gesamtbearbeitungszeiten von Interesse, sondern vielmehr die Geschwindigkeits- 
steigerungen gegeniiber der sequentiellen Verarbeitung, der sogenannte Speedup. 
Da sich dieser nur schlecht vorhersagen lafit, werden zunachst stattdessen die Over- 
heads betrachtet, die dazu fiihren, dafi beim Einsatz von N Prozessoren die parallele 
Verarbeitung i.a. nicht N-mal schneller ist. AnschlieEend wird versucht, eine 
Abschatzung des durch eine Parallelisierungsvariante maximal zu erreichenden 
Speedups vorzunehmen, indem das tatsachliche Verhalten der verschiedenen Paral- 
lelisierungsvarianten durch Analysemodelle abgebildet wird. 
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Die im Kapitel 4 und 5 dargestellten Verfahrens- und Parallelisierungsvarianten 28 
sind, wie oben schon erwahnt, auf verschiedenen Hardwarearchitekturen imple- 
mentiert worden. Im sechsten Kapitel werden daher die verwendeten Hardwarear- 
chitekturen sowie die speziellen Implementationen und ggf. die eingesetzte Software 
beschrieben. 

Im Anschlufi hieran erfolgt im siebten Kapitel eine detaillierte Analyse des Losungs- 
verhaltens sowohl bei sequentieller als auch bei paralleler Verarbeitung. Hierzu 
werden zunachst die zugrunde gelegten Problemstellungen vorgestellt und anschlie- 
fiend umfangreiche Untersuchungen fur das PC-LAN vorgenommen. Vergleichende 
Gegeniiberstellungen ausgewahlter Verfahrens- und Parallelisierungsvarianten 
sowie der verschiedenen Modellformulierungen sollen Tendenzen beziiglich des 
Losungsverhaltens aufzeigen. 

Im Zusammenhang mit der parallelen Verarbeitung interessieren des weiteren die 
jeweils erreichten Speedups sowie die Overheads, die zu einem nichtlinearen 
Speedup fiihren. Ein weiterer wesentlicher Punkt ist die Verifikation der im fiinften 
Kapitel aufgestellten Analysemodelle. Hierbei wird insbesondere untersucht, in- 
wieweit die vereinfachenden Annahmen die Giiltigkeit der Analysemodelle in Frage 
stellen. Neben den Ergebnissen der PC-LAN-Implementation werden auch Ergeb- 
nisse der Workstation-Implementation vorgestellt. 

Da die Parallelverarbeitung nur dann betriebswirtschaftlich zu vertreten ist, wenn 
sie ein gegeniiber der sequentiellen Verarbeitung angemessenes Kosten-Leistungs- 
verhaltnis aufweist, erfolgt als letztes eine okonomische Bewertung der Parallelver- 
arbeitung. Hierzu wird zunachst allgemein die Parallelverarbeitung betrachtet sowie 
mogliche Probleme bei der parallelen Implementation aufgezeigt. AbschliePend 
erfolgt eine Bewertung der Parallelverarbeitung im Zusammenhang mit dem vorge- 
stellten Branch-and-Bound-Algorithmus zur Losung gemischt-ganzzahliger Opti- 
mierungsprobleme. 



28 Im folgenden werden die im Zusammenhang mit der sequentiellen Verarbeitung vorgestellten 
algorithmischen Moglichkeiten als Verfahrensvarianten und die im Zusammenhang mit der 
parallelen Verarbeitung vorgestellten algorithmischen Moglichkeiten als Parallelisierungsvarian- 
ten bezeichnet. 




2. Mathematische Formulierung betriebswirtschaftlicher 
Entscheidungsprobleme am Beispiel der Produktions- 
planung 

Die Untersuchung der Moglichkeiten einer Parallelverarbeitung bei der Losung 
betriebswirtsc±iaftlicher Entscheidungsprobleme wird am Beispiel der Produktions- 
planung durchgefiihrt. Bevor jedoch die konkrete Planungsaufgabe sowie das 
entsprechende Produktionsplanungsmodell vorgestellt werden, erfolgt zunachst 
eine kurze Darstellung der Aufgaben der betriebswirtschaftlichen Planung, des 
betriebswirtschaftlichen Entscheidungsproblems und dessen allgemeiner mathema- 
tischer Formulierung sowie eine Beschreibung ausgewahlter Modellierungstechni- 
ken, die im Zusammenhang mit der modellhaften Abbildung betriebswirtschaftli- 
cher Entscheidungsprobleme von grofier Bedeutung sind und die, wie sich zeigen 
wird, auch fur die mathematische Formulierung der im folgenden betrachteten 
Produktionsplanungsaufgabe benotigt werden. 

Aufgrund der Bedeutung der Modellformulierung fiir den Bearbeitungsaufwand 
werden insbesondere Ansatze vorgestellt, die einen positiven Einflufi auf das 
Losungsverhalten versprechen. 

2.1. Betriebswirtschaftliche Planung 

Im Rahmen der Betriebswirtschaftslehre besteht die Aufgabe der Planung darin, aus 
einer Moglichkeit von festzulegenden Handlungsaltemativen diejenige zu bestim- 
men, die zu einem moglichst hohen Erfiillungsgrad der vom Unternehmen 
festgelegten Zielsetzung fiihrt . 29 

Anhand der Wirkungsdauer der im Rahmen der Planung getroffenen Entscheidun- 
gen wird zwischen strategischer (langfristiger), taktischer (mittelfristiger) und ope- 
rationaler (kurzfristiger) Planung unterschieden. 

Die strategische Planung umfafit diejenigen Entscheidungen, die eine langfristige 
Wirkung auf den Unternehmenserfolg besitzen 30 Durch sie werden Richtlinien fiir 
die zu verfolgende Unternehmenspolitik festgelegt 31 



29 Adam, D.: Kurzlehrbuch Planung, 2. Aufl., Wiesbaden 1983, S. 11 

30 PETERSON und SILBER z.B. nennen hier einen Zeitraum von mehr als zwei Jahren. Vgl. hierzu: 
Peterson, R., Silver, E.A.: Decision Systems For Inventory Management And Production Plan- 
ning, New York Chichester 1979, S. 669 

31 Beispiele fiir im Rahmen der strategischen Planung anfallende Entscheidungen finden sich z.B. 
in: Adam, D.: Kurzlehrbuch Planung, a.a.O., S. 35 
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Die taktische Planung vollzieht sich innerhalb des durch die strategische Planting 
vorgegebenen Rahmens. Sie ist mittelfristiger Natur, d.h. der Planungszeitraum 
sollte grower als ein Saisonzyklus sein, jedoch zwei Jahre nicht iiberschreiten . 32 ' 33 

Im Rahmen der operationalen Planung werden kurzfristige Entscheidungen auf der 
Grundlage der durch die strategische und die taktische Planung gegebenen Ent- 
scheidungen getroffen 34 

2.2. Das betriebswirtschaftliche Entscheidungsproblem 

Die Planung vollzieht sich innerhalb eines Planungsprozesses. Hierzu mtissen zu- 
nachst fur das betrachtete Planungsproblem die relevanten Daten ermittelt werden. 
Auf der Grundlage dieser Daten werden Handlungsaltemativen entwickelt und an- 
schliefiend die im Hinblick auf die gewahlte Zielsetzung beste Handlungsalternative 
ausgewahlt . 33 Die Entwicklung der Handlungsaltemativen und die Auswahl der 
besten Alternative werden im folgenden als betriebswirtschaftliches Entschei- 
dungsproblem bezeichnet. Die Abbildung des Entscheidungsproblems erfolgt mit 
Hilfe eines betriebswirtschaftlichen Entscheidungsmodells 36 . Hierbei handelt es sich 
zumeist um ein mathematisches Modell 37 

Die Giite einer Planung ist entscheidend davon abhangig, wie gut es gelingt, die 
Handlungsaltemativen in bestimmten Umweltsituationen und ihre entscheidungsre- 



32 Bensoussan, A., Crouhy, M., Proth, J.-M.: Mathematical Theory of Production Planning, 
Amsterdam New York 1983, S. 2 

33 Beispiele fur im Rahmen der taktischen Planung anfallende Entscheidungen finden sich z.B. in: 
Adam, D.: Kurzlehrbuch Planung, a.a.O., S. 36; Stadtler, H.: Hierarchische Produktionsplanung 
bei losweiser Fertigung, Heidelberg 1988, S. 9 

34 Kilger, W.: Optimale Produktions- und Ablaufplanung, Opladen 1973, S. 19 

33 Eine detaillierte Unterteilung des Planungsprozesses, das sogenannte 5-Stufen-Schema, findet 
sich in: Arbeitskreis Hax der Schmalenbach-Gesellschaft: Investitions- und Finanzentscheidun- 
gen im Rahmen langfristiger Unternehmenspolitik, ZfbF, 22. Jg., 1970, S. 741-770, hier S. 752 

3 ^ Zum Begriff des Modells vgl. z.B.: Dinkelbach, W.: Modell - ein isomorphes Abbild der Wirk- 
lichkeit?, in: Grochla, E., Szyperski, N. (Hrsg.), Modell- und computergestiitzte Untemehmens- 
planung, Wiesbaden 1973, S. 153-162; zum Begriff betriebswirtschaftliches Modell vgl. z.B.: 
Adam, D., Witte, T.: Betriebswirtschaftliche Modelle: Aufgabe, Aufbau, Eignung (I), WISU, 4. 
Jg., 1975, S. 369-371 und Adam, D., Witte, T.: Betriebswirtschaftliche Modelle: Aufgabe, Aufbau, 
Eignung (II), WISU, 4. Jg., 1975, S. 419-423; eine Definition des Begriffs Entscheidungsmodell 
findet sich in: Dinkelbach, W.: Entscheidungsmodelle, in: Grochla, E. (Hrsg.), Handworterbuch 
der Organisation, 2. Aufl., Stuttgart 1980, Sp. 623-633 

37 Adam, D., Witte, T.: Typen betriebswirtschaftlicher Modelle, WISU, 5. Jg., 1976, S. 1-5, hier S. 1 
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levanten Komponenten zu erkennen, sie in einem Modell zu erfassen und dieses 
dann mit Hilfe eines geeigneten Verfahrens zu losen . 38 

Da fiir die Entscheidungsprobleme der strategischen Planung i.a. nur unvollstandige 
Informationen vorliegen und sich die Planungsaufgabe nur schlecht quantifizieren 
und strukturieren lafit, ist hier der Einsatz mathematischer Modelle nur sehr be- 
schrankt moglich . 39 

Fiir die Entscheidungsprobleme der taktischen Planung sind die funktionalen Zu- 
sammenhange hinreichend bekannt. Durch eine Aggregation von Daten lassen sich 
Unsicherheiten bzgl. der Daten vermindern, so dafi die taktische Planung in der Re- 
gel mit ihren wesentlichen Inhalten in einem mathematischen Modell abgebildet 
werden kann . 40 

Die operationale Planung zeichnet sich dadurch aus, dafi zu den meisten Entschei- 
dungsproblemen auch mathematische Modelle existieren. Aufgrund der grofien 
Menge von relevanten Daten auf detaillierter Basis und der zumeist zahlreichen 
Handlungsaltemativen ergeben sich jedoch haufig Schwierigkeiten bei der Losung 
der Modelle . 41 

2.3. Das allgemeine Modell eines betriebswirtschaftlichen Entschei- 
dungsproblems 

Das mathematische Modell zur Abbildung eines betriebswirtschaftlichen Entschei- 
dungsproblems besteht aus 

- einer Anzahl von kontinuierlichen oder ganzzahligen Entscheidungsvariablen 
x=(x 1 ,...,x n ), die die moglichen Handlungsaltemativen reprasentieren, 

- einer Zielfunktion f, welche die verfolgte Zielsetzung abbildet, 

- einer oder mehreren Gleichungen oder Ungleichungen gj, i=l,...,m, den sogenann- 
ten Nebenbedingungen, die die Beschrankungen bj, i=l,... / m, fiir die Werte der 
Entscheidungsvariablen zum Ausdruck bringen, und 



88 Brauer, K.M.: Binare Optimierung, Koln Berlin 1969, S. 13 

89 Stadtler, H.: a.a.O., S. 8 

4 0 Gunther, H.-O.: Mittelfristige Produktionsplanung, Konstruktion und Vergleich quantitativer 
Modelle, Miinchen 1982, S. 12 

41 Gunther, H.-O.: a.a.O., S. 13 
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- der Nichtnegativitatsbedingung im Falle kontinuierlicher Entscheidungsvariablen 
bzw. der Ganzzahligkeitsbedingung im Falle ganzzahliger Entscheidungsvaria- 
blen. 42 

Dargestellt wird ein allgemeines Modell in folgender Form: 

f(x) = max! (2.1) 

gi(x)<bi V i=l,..,m (2.2) 

x > 0 bzw. x ganzzahlig (2.3) 

Flierbei handelt es sich um ein Maximierungsmodell. Da sich jedes Minimierungs- 
modell durch Multiplikation mit -1 in ein Maximierungsmodell uberfuhren lafit, 
wird im folgenden von einem Maximierungsmodell ausgegangen, es sei denn, es 
wird explizit darauf hingewiesen, dafi dem betrachteten Sachverhalt ein Minimie- 
rungsmodell zugrunde liegt. 

Je nach der Art der Zielfunktion und der Nebenbedingungen - linear oder nicht- 
linear - und der Variablen - kontinuierlich oder ganzzahlig - ergeben sich als wich- 
tigste Modelle 

- lineare kontinuierliche Modelle 43 , 

- lineare ganzzahlige Modelle 44 sowie 

- nichtlineare Modelle 45 . 

In der betriebswirtschaftlichen Praxis besteht zum einen haufig die Notwendigkeit, 
logische Beziehungen 46 , wie z.B. WENN-DANN-, UND- bzw. ODER-Beziehungen 



42 Hillier, F.S., Liebermann, G.J.: Introduction to Operations Research, 4. Aufl., Oakland 1986, S. 19 

43 Lineare kontinuierliche Modelle besitzen eine lineare Zielfunktion und lineare Nebenbedingun- 
gen sowie kontinuierliche Variablen. Sie werden im allgemeinen Sprachgebrauch auch kurz als 
lineare Modelle bezeichnet. 

44 Lineare ganzzahlige Modelle besitzen statt kontinuierlichen ganzzahlige Variablen. Wird nicht 
fur alle, sondem nur fur einige Variablen die Ganzzahligkeit gefordert, handelt es sich um ge- 
mischt-ganzzahlige Modelle. Lineare ganzzahlige bzw. gemischt-ganzzahlige Modelle werden 
im allgemeinen Sprachgebrauch nur kurz als ganzzahlige bzw. gemischt-ganzzahlige Modelle 
bezeichnet. 

45 Bei nichtlinearen Modellen sind die Zielfunktion und /oder die Nebenbedingungen nichtlineare 
Funktionen. Beispiele hierfiir sind z.B. quadratische Modelle, bei denen die Zielfunktion qua- 
dratische Terme aufweist, separable Modelle sowie aber auch geometrische, konvexe und nicht- 
konvexe Modelle. Vgl. hierzu: Williams, H.P.: Model Building in Mathematical Programming, 2. 
Aufl., Chichester New York 1985, S. 130 ff 
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sowie Multiple-Choice-Situationen, modellmafiig zu erfassen. Zum anderen existie- 
ren oftmals nichtlineare Zusammenhange, die ebenfalls abgebildet werden miissen. 
Die hierzu bestehenden Modellierungstechniken, die im nachsten Abschnitt vorge- 
stellt werden, fiihren in der Regel auf gemischt-ganzzahlige Modelle, bei denen die 
ganzzahligen Variablen nur den Wert 0 oder 1 annehmen diirfen. 47 

Der Aufwand fiir die Berechnung ganzzahliger bzw. gemischt-ganzzahliger Opti- 
mierungsmodelle hangt im wesentlichen von zwei Grofien ab, und zwar zum einen 
von der Anzahl der Nebenbedingungen und zum anderen von der Anzahl der 
ganzzahligen Variablen. Letztere bestimmt die kombinatorische Komplexitat des 
Problems, d.h. die Anzahl der verschiedenen Kombinationen von Wertebelegungen 
fur die ganzzahligen Variablen. 



2.4. Allgemeine Modellierungstechniken 

1st fiir eine kontinuierliche Variable x zwischen den beiden Zustanden x = 0 und 
x > 0 zu unterscheiden, so geschieht dieses mit Hilfe einer Indikatorvariablen y, die 
wie folgt definiert ist: 



1, falls der Zustand x > 0 eintritt 



y = 



0, sonst 



Die sich daraus ergebende WENN-DANN-Beziehung 
x > 0 => y = 1 

wird durch die Nebenbedingung 

x < M y (2.4) 

abgebildet 48 , wobei M eine obere Grenze fiir x ist. 49 



4 6 Brauer, K.M.: a.a.O., S. 15 

47 Williams, H.P.: a.a.O., S. 146 

48 Williams, H.P.: a.a.O., S. 163 

49 Ein typisches Anwendungsbeispiel fiir eine WENN-DANN-Beziehung ist das Fixed Charge 
Problem, das durch Bedingungen der Art "WENN eine Aktivitat stattfindet, DANN sind unab- 
hangig von der Intensitat der Aktivitat Fixkosten zu beriicksichtigen" charakterisiert ist. Das 
Fixed Charge Problem ist allgemein beschrieben in: Williams, H.P.: a.a.O., S. 163 f 
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Ein Spezialfall tritt ein, wenn eine Indikatorvariable y\ nicht mit einer kontinuierli- 
chen Variablen x, sondern mit einer 0/1-Variablen y 2 , die selbst eine Indikatorva- 
riable ist, in Beziehung steht. 



1, falls der ZustandZi eintritt 



Yi = 



0, sonst 



V i=l,2 



Es lassen sich in diesem Fall folgende WENN-DANN-Beziehungen zwischen 0/1- 
Variablen abbilden: 



yi=l => y 2 =l 

y i = i => y 2=0 
y i = o => y 2 =i 

yi=0 => y 2 = 0 



durch yj - y 2 < 0 
durch yi + y 2 < 1 
durch y^ + y 2 > 1 
durch y 2 - yi <0 



Sie drucken eine Beziehung zwischen zwei Zustanden Zj und Z 2 aus, die beide fiber 
Indikatorvariablen gesteuert werden. 

Neben der Abbildung von WENN-DANN-Beziehungen zwischen Indikatorvaria- 
blen lassen sich auch UND-Beziehungen der Art 

y 1= l A y 2 =l 



durch die Nebenbedingung 

yi + y2 = 2 (2.5) 

sowie ODER-Beziehungen der Art 

yi = i v y2 =1 



durch die Nebenbedingung 
yi + y 2 >1 



(2.6) 



abbilden. 

Eine Multiple-Choice-Situation liegt vor, wenn von einer Menge moglicher Zustande 
nur hochstens einer eintreten darf oder genau einer eintreten mufi. 50 Die Abbildung 



50 



Hummel tenberg, W.: Implementations of special ordered sets in MP software, EJOR, Vol. 17, Nr. 
1, 1984, S. 1-15, hier S. 3 
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eines derartigen Problems fiihrte zur Entwicklung der Special Ordered Set vom Typ 
1 (SOS1) 51 

Eine ahnliche Situation besteht, wenn von einer Menge moglicher Zustande, die 
zueinander eine gegebene Reihenfolge einnehmen, ein Zustand eintreten mufi oder 
zwei aufeinanderfolgende Zustande. Fiir diesen Fall wurde der Special Ordered Set 
vom Typ 2 (SOS2) eingefiihrt. 

Sowohl der SOS1 als auch der SOS2 wurden erstmals von BEALE und TOMLIN 52 
definiert. 

Definition 2.1: Ein SOS1 ist eine Menge von nichtnegativen Variablen, von 

denen hochstens eine Variable einen Wert ungleich Null 
annehmen darf. 

Definition 2.2: Ein SOS2 ist eine Menge von nichtnegativen Variablen mit 

fester Reihenfolge, von denen mindestens eine, aber hochstens 
zwei benachbarte Variablen einen Wert ungleich Null anneh- 
men diirfen. 

Beim SOS1 mufi unterschieden werden, ob die SOS- Variablen kontinuierliche oder 
0/1-Variablen sind. Fur den Fall binarer Variablen yj lauten die Nebenbedingun- 
gen 53 : 

n n 

Xys - 1 bzw - Xyi =1 (2.7) 

i=l i=l 



Yi ^ {0,1} 



V i=l,...,n 



(2.8) 



51 Im Zusammenhang mit der Abbildung betriebswirtschaftlicher Entscheidungsprobleme treten 
haufig Multiple-Choice-Situationen auf, wie z.B. beim Zuordnungsproblem, wo jedes Objekt 
genau einem anderen Objekt zugeordnet werden mufi, oder beim Rundreiseproblem, wo jeder 
Ort genau einmal besucht werden mufi. (Die Problembeschreibung und die Modellformulierung 
fiir das Zuordnungsproblem finden sich z.B. in: Schmitz, P., Schonlein, A.: Lineare und lineari- 
sierbare Optimierungsmodelle sowie ihre ADV-gestiitzte Losung, Braunschweig 1978, S. 136 ff 
bzw. S. 210 ff; und die Problembeschreibung und die Modellformulierung fur das Rundreise- 
problem (Traveling Salesman Problem) finden sich z.B. in: Domschke, W.: Logistik: Rundreisen 
und Touren, 1. Aufl., Miinchen Wien 1982, S. 56 ff) 

52 Beale, E.M.L., Tomlin, J.A.: Special Facilities in a General Mathematical Programming System 
for Non-convex Problems Using Ordered Sets of Variables, in: Lawrence, J. (Hrsg.), Operational 
Research '69, Proceedings of the 5th International Conference on Operations Research, Tavistock 
London 1970, S. 447-454, hier S. 448 

53 Hummeltenberg, W.: a.a.O., hier S. 2 
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Besteht der SOS1 dagegen aus kontinuierlichen Variablen Xj, so ist zwischen den 
Zustanden Xj > 0 und Xj =0 zu unterscheiden. Dieses geschieht, wie oben beschrie- 
ben, iiber Indikatorvariable yj. Die Abbildung des SOS1 besteht damit aus vier 
Nebenbedingungen, den Bedingungen (2.7) und (2.8) sowie den Bedingungen 



Xj < M yj 


V i=l,...,n 


(2.9) 


Xj >0 


V i=l,...,n 


(2.10) 



die die Verbindung zwischen den kontinuierlichen und den Indikatorvariablen her- 
stellen. 54 



2.5. Anwendung der Modellierungstechniken im Rahmen der Pro- 
duktionsplanung 

2.5.1. Begriffsdefinitionen 

Der Begriff der Produktion ist im folgenden auf die Erzeugung von Sachleistungen 
beschrankt und wird als Synonym fur den Ausdruck 'Fertigung' verwendet. 55 

Als Produktionsplanung wird allgemein die Planung aller Mafinahmen hinsichtlich 
der in Zukunft zu fertigenden Produkte bezeichnet. Diese Definition lafit jedoch be- 
ziiglich des Inhaltes einen gewissen Spielraum, so dafi in der betriebswirtschaftli- 
chen Literatur Uneinigkeit besteht, welcher Umfang der Produktionsplanung und 
welche Gliederung in Teilbereiche sich daraus ergibt. 56 

Die gelaufigste Gliederung gibt GUTENBERG 57 : Hiernach wird die Produktions- 
planung in Produktionsprogrammplanung, Bereitstellungsplanung und Planung des 
Produktionsprozesses unterteilt, wobei die beiden zuletzt genannten Bereiche unter 
dem Begriff Produktionsvollzugsplanung zusammengefafit werden. 



54 SOS2 werden hauptsachlich zur Linearisierung separabler Funktionen eingesetzt. Da im folgen- 
den jedoch stets von einer linearen Zielfunktion und linearen Nebenbedingungen ausgegangen 
wird, wird auf eine detaillierte Darstellung der zur Abbildung eines SOS2 notwendigen Neben- 
bedingungen verzichtet. Sie findet sich z.B. in: Schmitz, A., Schonlein, P.: a.a.O., S. 319 

55 Diese Einschrankung wird z.B. auch von STADTLER vorgenommen. Vgl. hierzu: Stadtler, H.: 
a.a.O., S. 12 

55 Kurbel, K.: Simultane Produktionsplanung bei mehrstufiger Serienfertigung, Moglichkeiten und 
Grenzen der Losgrofien-, Reihenfolge- und Terminplanung, Berlin 1978, S. 1 

57 Kurbel, K.: a.a.O., S. 1 
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Andere Autoren dagegen beschranken den Begriff nur auf die Planung des Produk- 
tionsvollzugs 58 oder aber fassen ihn noch weiter als GUTENBERG. ELLINGER 59 
z.B. sehlieJSt auch die Planung der Produkte in die Produktionsplanung mit ein. 

ADAM 60 dagegen schlagt eine detailliertere Gliederung als GUTENBERG vor. Sie 
bildet die Grundlage fur die weitere Betrachtung. 

2.5.2. Teilbereiche der Produktionsplanung 

Gemafi der Gliederung von ADAM lafit sich die Produktionsplanung in 

- die Produktionsprogrammplanung, 

- die Produktionsaufteilungsplanung, 

- die Emanzipationsplanung, 

- die Losplanung, die sich noch weiter unterteilen lafit in 

- die Losgrofienplanung, 

- die Lossequenzplanung und 

- die Sortenreihenfolgeplanung, sowie 

- die zeitliche Ablaufplanung 

unterteilen. 

Die Programmplanung und die Aufteilungsplanung betrachten keinerlei zeitliche 
Zusammenhange und fallen damit in den Bereich der statischen Produktionspla- 
nung. Demgegeniiber stehen bei der Emanzipations-, der Los- und der zeitlichen 
Ablaufplanung die Fragen des zeitlichen Vollzugs der Fertigung im Vordergrund 
der Betrachtung. Diese Teilbereiche bilden deshalb den Inhalt der dynamischen 
Produktionsplanung . 61 



5 8 Bufimann, K.-F., Mertens, P.: Produktionsplanung mit Hilfe des Operations Research und der 
elektronischen Datenverarbeitung, in: BuGmann, K.-F., Mertens, P. (Flrsg.), Operations Research 
und Datenverarbeitung bei der Produktionsplanung, Stuttgart 1968, S. 5-7, hier S. 5 

^ 9 Ellinger, T.: Ablaufplanung - Grundfragen der Planung des zeitlichen Ablauts der Fertigung im 
Rahmen der industriellen Produktionsplanung, Stuttgart 1959, S. 14 

60 Adam, D.: Produktionsplanung bei Sortenfertigung, Wiesbaden 1969, S. 23 f 

61 Adam, D.: Produktionsplanung bei Sortenfertigung, a.a.O., S. 22 ff 
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2.5.2.1. Produktionsprogrammplanung 

Die Produktionsprogrammplanung legt die Arten und Mengen an herzustellenden 
Erzeugnissen innerhalb des betrachteten Planungszeitraums fest . 62 

Die Grundlage fur die Bestimmung des gewinnmaximalen Produktionsprogramms 
ist das sich aus der Absatzplanung ergebende Absatzprogramm. Es gibt fur jede 
Produktart die fur den betrachteten Planungszeitraum erwarteten Absatzhochst- 
grenzen an . 63 Diese gehen unmittelbar als Bedarfe in die Programmplanung ein. 
Hierbei wird im Rahmen der Programmplanung nur der Fall von im Zeitablauf ge- 
ringen Schwankungen der Absatzmengen betrachtet . 64 Die Absatzgeschwindigkeit 
wird dementsprechend als konstant fur den gesamten Planungszeitraum angenom- 
men. 

Die Produktionskapazitaten sowie die variablen Produktionskosten gehen als Datum 
in die Planung ein. Somit wird im Rahmen der Produktionsprogrammplanung das 
Problem intensitatsmafiiger Anpassungsprozesse sowie das Problem des Vorhan- 
denseins von funktionsgleichen, aber kostenverschiedenen Produktionsanlagen 
ebenso wenig betrachtet wie die Planung des zeitlichen Ablaufs der Produktion. 

2.5.2.2. Produktionsaufteilungsplanung 

Stehen fur die Produktion mehrere funktionsgleiche, aber kostenverschiedene Pro- 
duktionsanlagen zur Verfiigung oder sind die Produktionsanlagen intensitatsmaPig 
anpafibar, lassen sich die Produktionskosten iiber die gewahlte Aufteilung der Pro- 
duktionsmengen auf die einzelnen Produktionsanlagen und die realisierten Intensi- 
ty ten beeinflussen . 65 Die Aufgabe der Produktionsaufteilungsplanung besteht dann 
darin, die kostenminimale Aufteilung der Produktionsmengen der einzelnen Er- 
zeugnisarten auf die verschiedenen Produktionsanlagen vorzunehmen . 66 Wird die 
Aufteilungsplanung isoliert von der Programmplanung betrachtet, sind die herzu- 
stellenden Mengen nicht Planungs grofie, sondern vorgegeben. 



6 2 Im Zusammenhang mit der quantitative!! und der qualitativen Komponente sprechen einige 
Autoren auch von quantitativer und qualitativer Produktionsprogrammplanung. Vgl. hierzu: 
Kurbel, K.: a.a.O., S. 3 

63 Zapfel, G.: Produktionswirtschaft, Operatives Produktions-Management, Berlin New York 1982, 
S. 49 

64 Der Fall starker Schwankungen, wie dieses bei jahreszeitlich unterschiedlichem Kaufverhalten 
der Fall ist, ist Gegenstand der Emanzipationsplanung. Vgl. hierzu: Kurbel, K.: a.a.O., S. 2 

63 Adam, D.: Produktionsplanung bei Sortenfertigung, a.a.O., S. 42 

66 KILGER spricht auch von einer Verfahrenswahlentscheidung. Vgl. hierzu: Kilger, W.: a.a.O., S. 
159 
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2.5.2.3. Emanzipationsplanung 

Unterliegt die Absatzentwicklung z.B. aufgrund saisonaler Einfliisse im Zeitablauf 
wesentlichen Schwankungen, kann es sinnvoll oder aufgrund von Kapazitatseng- 
passen sogar notwendig sein, die zeitliche Produktionsentwicklung von der Absatz- 
entwicklung abzuheben. Hierzu wird der betrachtete Planungszeitraum, der min- 
destens einen Saisonzyklus umfassen sollte, in Teilperioden zerlegt . 67 Die fur jede 
Teilperiode herzustellenden Mengen sind aus dem Absatzprogramm bekannt und 
gehen ebenso wie die zur Verfugung stehende Produktions- und Lagerkapazitat als 
Datum in die Planung ein. Die Aufgabe der Emanzipationsplanung ist es, unter den 
gegebenen Pramissen diejenigen Produktions- und Lagermengen fur jede Teilperi- 
ode zu bestimmen, die zu einer minimalen Summe aus Produktions- und Lager- 
kosten fuhren. 

2.5.2.4. Losgrofienplanung 

Werden mehrere Erzeugnisarten auf einer Produktionsanlage hergestellt, mufi bei 
einem Wechsel von einer Erzeugnisart zu einer anderen Erzeugnisart die Anlage auf 
die Erfordernisse des neuen Erzeugnisses umgeriistet werden. Die Losgrofienpla- 
nung legt in diesem Zusammenhang isoliert fur jede Erzeugnisart (Sorte) die Anzahl 
der zwischen zwei aufeinanderfolgenden Umstellungen zu fertigenden Produktein- 
heiten, die sogenannte Losgrofie, fest . 68 Die mit jeder Umriistung verbundenen 
Umriistzeiten und -kosten werden hierbei als reihenfolgeunabhangig angenommen, 
d.h. der Wert dieser Grofien wird ausschliefilich von der neu aufzulegenden Sorte 
bestimmt, wahrend der vorausgehende Produktionszustand nicht berucksichtigt 
wird. 

Die Losgrofienplanung hat zwei gegenlaufige Kostenkomponenten - die Umrtist- 
und die Lagerkosten - zum Ausgleich zu bringen. Soli die aus einer gegebenen Ab- 
satzgeschwindigkeit resultierende Produktionsmenge innerhalb des Planungszeit- 
raums hergestellt werden, sinkt die Zahl der insgesamt benotigten Umrustungen, 
wenn die Losgrofie steigt. Da die Umrustkosten unabhangig von der Losgrofie bei 
jeder Umriistung anfallen, sinken demzufolge die Umrustkosten bei wachsender 
Losgrofie. 



67 Zapfel, G.: a.a.O., S. 142 f 

68 Adam, D.: Produktionsplanung bei Sortenfertigung, a.a.O., S. 51 ff und die dort angegebene Li- 
teratur zum Losgrofienproblem 
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Auf der anderen Seite fiihrt eine Erhohung der Losgrofie bei gleichbleibender Ab- 
satzgeschwindigkeit dazu, dafi die einzulagernde Menge und damit auch die Lager- 
kosten, die im Gegensatz zu den Umriistkosten mengenabhangig sind, steigen. Es 
entsteht demzufolge ein Zielkonflikt zwischen geringer Losgrofie und damit ver- 
bundenen geringen Lager- und hohen Umriistkosten einerseits und hoher LosgroPe 
und damit verbundenen geringen Umriist- und hohen Lagerkosten andererseits. Die 
optimale LosgroPe ist erreicht, wenn die Summe aus Rust- und Lagerkosten pro 
Einheit minimal ist. 

2.5.2.5. Lossequenzplanung 

Bei der LosgroPenplanung wird die Belegung der Produktionsanlagen isoliert fur 
jede Sorte durchgefuhrt. Es ergibt sich in diesem Fall fiir jede Sorte ein Losauflage- 
plan, bei dem mit der Produktion eines neuen Loses begonnen wird, wenn die La- 
gerbestande des vorhergehenden Loses vollstandig abgebaut sind. Bei der isolierten 
Betrachtung kommt es in der Regel aufgrund fehlender Abstimmung der Bele- 
gungszeiten durch die einzelnen Sorten zu einer Mehrfachbelegung einzelner oder 
aller betrachteten Produktionsanlagen. Bestehen dariiber hinaus Beschrankungen 
des Lagerraums, ergeben sich u.U. LosgroPen, welche die Lagerkapazitat iiberschrei- 
ten. Die Aufgabe der Lossequenzplanung ist es, einen uberschneidungsfreien Bele- 
gungsplan unter gleichzeitiger Einhaltung eventueller Lagerraumbeschrankungen 
mit minimalen Kosten zu ermitteln . 69 Hierbei handelt es sich um ein zweistufiges 
Problem 70 , da zum einen die Auflagenreihenfolge fiir die einzelnen Produktionsan- 
lagen bestimmt werden muP und zum anderen die jeweiligen LosgroPen zu ermit- 
teln sind, die die geforderten Bedingungen erfiillen. Die herzustellende Menge ist 
auch hier, genau wie bei der LosgroPenplanung, durch das Absatzprogramm vorge- 
geben. 



2.5.2.6. Sortenreihenfolgeplanung 

Die Lossequenzplanung geht grundsatzlich von reihenfolgeunabhangigen Umriist- 
zeiten und -kosten aus. Innerhalb der betriebswirtschaftlichen Praxis ist dieses je- 
doch haufig als eine vereinfachende Annahme anzusehen, da die Kosten und Zeiten 
oftmals stark von der Auflagenreihenfolge abhangig sind. Im Rahmen der Sortenrei- 



Dinkelbach, W.: Zum Problem der Produktionsplanung in Ein- und Mehrproduktunternehmen, 
Wurzburg Wien 1964, S. 47 

70 Ofiwald, J.: Produktionsplanung bei losweiser Fertigung, Wiesbaden 1979, S. 10 
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henfolgeplanung 71 wird fur den Zeitraum eines Loszyklus die riistkostenminimale 
Sortenreihenfolge auf jeder Produktionsanlage bestimmt. Abhangigkeiten zwischen 
den Auflageplanen werden, ebenso wie im Falle des Losgrofienproblems, nicht be- 
handelt. Ferner wird von der vereinfachenden Pramisse ausgegangen, dafi innerhalb 
eines Loszyklus jede Sorte genau einmal aufgelegt wird. Die Losgrofie selber ist fur 
die Sortenreihenfolgeplanung uninteressant, da die Riistkosten und -zeiten hiervon 
nicht abhangig sind und Produktions- und Lagerkosten nicht betrachtet werden. 

2.5.2.7. Zeitliche Ablaufplanung 

Bei der Beriicksichtigung des zeitlichen Ablaufs der bisher betrachteten Teilbereiche 
der Produktionsplanung wird von der vereinfachenden Annahme einer einstufigen 
Fertigung ausgegangen. Das Ziel der zeitlichen Ablaufplanung ist es, im Falle einer 
mehrstufigen Produktion einen fur alle Produktionsstufen zeitlich zulassigen 
Produktions durchlauf zu bestimmen, der die gewahlte Zielsetzung optimal erfiillt . 72 
Als Zielsetzung sind bei der zeitlichen Ablaufplanung sowohl zeitliche Minimie- 
rung, wie z.B. die Minimierung der Gesamtdurchlaufzeit, als auch kostenmafiige 
Minimierung denkbar, wobei letztere jedoch im Hinblick auf die Bewertung als 
problematisch anzusehen ist . 73 

Grundlage fiir die zeitliche Ablaufplanung ist ein vorgegebener Maschinenfolge- 
plan. Er gibt an, welche Produktionsanlagen in welcher Reihenfolge zur Bearbeitung 
der einzelnen Produktionsstufen der zu fertigenden Produktarten einzusetzen 
sind . 74 Die Losgrofien der verschiedenen Erzeugnisarten sind ebenfalls gegeben. Sie 
gehen in die Planung dadurch ein, dafi fiir die im Maschinenfolgeplan festgelegten 
Zuordnungen von Produktionsanlagen, Produktionsstufen und Produktarten jeweils 
Bearbeitungszeiten angegeben werden. 

2.5.3. Mathematische Abbildung der Teilbereiche der Produktionsplanung 

Fiir die einzelnen Teilbereiche der Produktionsplanung wurden in der Vergangen- 
heit eine Reihe von Modellen entworfen. Die Bestimmung eines gewinnoptimalen 
Produktionsprogramms 75 , die Losung des Aufteilungsproblems 76 und die Losung 



7 * Adam, D.: Produktionsplanung bei Sortenfertigung, a.a.O., S. 117 ff 

72 Ofiwald, J.: a.a.O., S. 12 

73 Seelbach, H.: Ablaufplanung, Wurzburg Wien 1975, S. 32 ff 

74 Kurbel, K.: a.a.O., S. 67 

73 Losungsansatze zur Planung des Produktionsprogramms finden sich z.B. in: Zapfel, G.: a.a.O., 
S. 92 ff; Kilger, W.: a.a.O., S. 95 ff 
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des Emanzipationsproblems 77 stellen hierbei eine lineare kontinuierliche Optimie- 
rungsaufgabe dar. Fur die Bestimmung der optimalen Losgrofie existiert die soge- 
nannte Losgrofienformel . 78 

Die Bestimmung der kostenminimalen Lossequenz lafit sich nicht mehr als kontinu- 
ierliches Optimierungsmodell entwickeln. Hier miissen zur Abbildung der produk- 
tionstechnischen Sachverhalte binare Variablen eingesetzt werden, so dafi ein ge- 
mischt-ganzzahliges Modell entsteht. 

Das Sortenreihenfolgeproblem entspricht fiir den Zeitraum eines Loszyklus einem 
Rundreiseproblem . 79 Es ist ein kombinatorisches Problem, das sich als rein binares 
Modell abbilden lafit . 80 

Fiir das zeitliche Ablaufproblem existieren eine Reihe von unterschiedlichen Model- 
lierungsvorschlagen, die sich in zeit- und in reihenfolgebezogene Modelle untertei- 
len lassen. Wahrend die zeitbezogenen Modelle nur Binarvariablen zur Modellie- 
rung einsetzen miissen, erfordert eine reihenfolgebezogene Modellformulierung 
auch den Einsatz von kontinuier lichen Variablen . 81 

Um auch die zwischen den einzelnen Teilbereichen bestehenden Interdependenzen 
zu beriicksichtigen, besteht die Notwendigkeit, die Teilbereiche zu einem Gesamt- 
system zusammenzufassen und eine gegenseitige Abstimmung aller Teilbereiche 
vorzunehmen. In der Literatur existieren deshalb eine Reihe von Simultanmodel- 
len . 82 



76 Kilger, W.: a.a.O., S. 178 ff 

77 Adam, D.: Produktionsdurchfuhrungsplanung, in: Jacob, H. (Hrsg.), Industriebetriebslehre, 
Handbuch fiir Studium und Praxis, 4. Aufl., Wiesbaden 1990, S. 677-918, hier S. 708 ff 

78 Zapfel, G.: a.a.O., S. 195; Adam, D.: Produktionsplanung bei Sortenfertigung, a.a.O., S. 51 

79 Ofiwald, J.: a.a.O., S. 11 

8 ^ Eine Formulierung des Traveling Salesman Problems als binares Modell findet sich z.B. in: 
Miiller-Merbach, H.: Optimale Reihenfolgen, Berlin Heidelberg 1970, S. 69 f; Domschke, W.: 
Logistik: Rundreisen und Touren, Miinchen Wien 1982, a.a.O., S. 58 ff 

81 SEELBACH stellt eine Reihe von Modellvorschlagen vor. Vgl. hierzu: Seelbach, H.: a.a.O., S. 40 
ff 

82 Die gegenseitige Abstimmung kann jedoch auch sukzessiv durchgefiihrt werden, d.h. die ein- 
zelnen Teilbereiche werden sukzessiv in einer vorher festgelegten Reihenfolge abgestimmt. Es 
ist bei dieser Vorgehensweise jedoch nicht gewahrleistet, dafi die optimale Losung gefunden 
wird. Vielmehr ist es wahrscheinlicher, dafi die gefundene Losung nur ein Suboptimum dar- 
stellt, da bei einem sukzessiven Vorgehen i.d.R. Interdependenzen vemachlassigt werden. Fer- 
ner ist es moglich, einen Teilplan aufzustellen, fiir den sich bei der Aufstellung des nachfolgen- 
den Teilplans zeigt, dafi er unzulassig ist, so dafi eine wiederholte Abstimmung vorzunehmen 
ist. Der Vorteil gegeniiber einer simultanen Abstimmung liegt darin, dafi die Sukzessiv planung 
eher die Losung von Produktionsplanungsproblemen praxisrelevanter Grofienordnungen zu- 
lafit. Vgl. hierzu z.B.: Zapfel, G.: a.a.O., S. 297; Stadtler, H.: a.a.O., S. 2 
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Wahrend einige Simultanmodelle nur einzelne Teilbereiche beriicksichtigen, wie z.B. 
das simultane Programm- und Emanzipationsplanungsmodell von ZAPFEL 83 oder 
das simultane Los- und Ablaufplanungsmodell von KURBEL 84 , versuchen andere 
Modelle, alle Teilbereiche zu erfassen. ADAM stellt ein simultanes Modell vor, mit 
dem eine "simultane Planung des Produktionsprogramms und des Betriebsab- 
laufs " 85 moglich ist. OSSWALD schlagt ein Modell vor, das "eine simultane Planung 
des Produktionsprogramms, der Losgrofien und des zeitlichen Vollzugs der 
Produktion " 86 ermoglicht. 

Ein weiteres Modell, welches ebenfalls die Abbildung aller Teilbereiche der Pro- 
duktionsplanung ermoglicht, wurde von PRESSMAR 87 entwickelt. Es versucht, die 
Komplexitat der Planungsaufgabe durch eine variable Zeitrasterung zu reduzieren 
und wird deshalb fiir die vorliegende Arbeit herangezogen. 

Aus Griinden der Ubersichtlichkeit wird in den folgenden Abschnitten zunachst nur 
das allgemeine, von der Problemstellung der Produktionsplanung losgeloste dyna- 
mische Planungsproblem beschrieben und das entsprechende dynamische Modell 
vorgestellt. Da die Modellformulierung einen ganz entscheidenden Einflufi auf das 
Losungsverhalten eines Modells besitzt, werden hierbei neben der urspriinglichen 
Modellformulierung von PRESSMAR noch zwei alternative Modellformulierungen 
vorgestellt. Anschliefiend erfolgt die Beschreibung eines auf wesentliche Sachver- 
halte der Produktionsplanung beschrankten Modells. Hierzu wird zunachst nur auf 
den Fall reihenfolgeunabhangiger Riistkosten und -zeiten eingegangen, bevor auch 
reihenfolgeabhangige Umrustungsvorgange in Form von sogenannten Blockum- 
riistungen Beriicksichtigung finden. Neben der Zielsetzung Gewinnmaximierung 
wird anschliefiend noch als ein Beispiel fur ein Produktionsplanungsmodell mit 



83 Zapfel, G.: a.a.O., S. 140 f 

84 Kurbel, K.: a.a.O., S. 118 ff 

83 Adam, D.: Simultane Ablauf- und Programmplanung bei Sortenfertigung mit ganzzahliger li- 
nearer Programmierung, ZfB, 33. Jg., Nr. 4, 1963, S. 233-245, hier S. 243 

83 Ofiwald, J.: a.a.O., S. 1 

87 Prefimar, D.B.: Evolutorische und stationare Modelle mit variablen Zeitintervallen zur simulta- 
nen Produktions- und Ablaufplanung, in Henn, R., et al. (Hrsg.), Proceedings in Operations Re- 
search 3, Wurzburg Wien 1974, S. 462-471; Prefimar, D.B.: Zur optimalen Bestimmung einer 
nichtstationaren Losgrofienpolitik unter Beriicksichtigung von Verzugsmengenkosten, ZfB, 47. 
Jg., Nr. 10, 1977, S. 609-632; Prefimar, D.B.: Modelling of Dynamic Systems by Linear Program- 
ming and its Application to the Optimization of Production Processes, in: Brans, J.P. (Hrsg.), 
Operational Research '84, Proceedings of the Tenth International Conference on Operational Re- 
search, Amsterdam New York 1984, S. 519-530; Prefimar, D.B.: Produktions- und Ablaufplanung 
auf der Grundlage von diskreten Produktionszustandsfunktionen, in: Adam, D. (Hrsg.), Neuere 
Entwicklungen in der Produktions- und Investitionspolitik, Wiesbaden 1987, S. 137-152 
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einem zeitorientierten Zielkriterium das Modell unter der Zielsetzung Durchlauf- 
zeitminimierung betrachtet. 

2.5.4. Das dynamische Planungsproblem 

Dynamische Planungsprobleme liegen immer dann vor, wenn in einer Entschei- 
dungssituation zeitinterdependente Zusammenhange bestehen, d.h. wenn eine Akti- 
on im Zeitpunkt t einerseits von vergangenen Aktionen, die in den Zeitpunkten 
t - A t stattgefunden haben, beeinflufit wird und andererseits diese Aktion Auswir- 
kungen auf kunftige Aktionen in den Zeitpunkten t + A t zeigt. 

Derartige dynamische Beziehungen der Zeitinterdependenz lassen sich in einem 
Planungsmodell dadurch abbilden, dafi der Planungszeitraum a priori in festgelegte 
Zeitintervalle unterteilt wird und auf der Grundlage dieses Zeitrasters die dynami- 
schen Beziehungen zwischen den Zeitinterv alien formuliert werden . 88 Diese impli- 
zite Zeitabbildung fiihrt jedoch zu einem Dilemma. 

Bei sehr grober Intervallteilung lafit sich zwar der Umfang des Planungsmodells 
relativ gering halten. Auf der anderen Seite werden die zeitlichen Freiheitsgrade des 
Modells derart eingeschrankt, dafi sich eine sehr schlechte Losung ergeben kann. 
Eine sehr feine Intervallteilung vermeidet zwar diesen Nachteil, fiihrt jedoch zu 
einer erheblichen Erhohung des Modellumfangs, da sowohl die Anzahl der Neben- 
bedingungen als auch die Anzahl der Variablen proportional zur Anzahl der Zeit- 
intervalle steigt . 89 

Ein Ausweg aus diesem Konflikt ist die Entwicklung eines Planungsmodells auf der 
Grundlage eines variablen und entscheidungsabhangigen Zeitrasters, das an die 
Stelle der a priori festgelegten Intervallteilung tritt. Mit diesem von PRESSMAR vor- 
geschlagenen Ansatz der expliziten Zeitabbildung reduziert sich der erforderliche 
Modellierungs- und Optimierungsaufwand erheblich. 

Wesentliche Einschrankungen der zeitlichen Freiheitsgrade ergeben sich lediglich, 
wenn sich innerhalb des Planungszeitraums die Umweltbedingungen andern. Bei 
der impliziten Zeitabbildung ist in diesem Fall die Intervallteilung so vorzunehmen, 
dafi jeder Periode eine eindeutige Umweltsituation zugeordnet werden kann. Da die 



88 Prefimar, D.B.: Evolutorische und stationare Modelle mit variablen Zeitintervallen zur simulta- 
nen Produktions- und Ablaufplanung, a.a.O., hier S. 463 f; Prefimar, D.B.: Zur optimalen Be- 
stimmung einer nichtstationaren Losgrofienpolitik unter Beriicksichtigung von Verzugsmengen- 
kosten, a.a.O., hier S. 610 

89 Prefimar, D.B.: Zur optimalen Bestimmung einer nichtstationaren Losgrofienpolitik unter Be- 
riicksichtigung von Verzugsmengenkosten, a.a.O., hier S. 610 
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Lange der Perioden bei der expliziten Zeitabbildung im vorab nicht bekannt ist, ist 
eine eindeutige Zuordnung nur moglich, wenn liber den gesamten Planungszeit- 
raum eine konstante Umweltsituation gilt. 90 Ist dieses nicht der Fall, mlissen auch 
hier die zeitlichen Freiheitsgrade eingeschrankt werden. Der gesamte Planungszeit- 
raum wird daflir, ahnlich wie bei der impliziten Zeitabbildung, in Zeitabschnitte 
konstanter Umweltsituation unterteilt. Innerhalb dieser Zeitabschnitte besteht aber 
weiterhin eine variable und entscheidungsabhangige Zeitrasterung. 

Im folgenden werden die Zeitabschnitte konstanter Umweltsituation in Anlehnung 
an PRESSMAR als Makroperioden und die variablen Zeitabschnitte innerhalb der 
Makroperioden als Mikroperioden oder auch nur kurz als Perioden bezeichnet. 

2.5.5. Das allgemeine dynamische Modell auf der Grundlage von diskreten 
Zustandsfunktionen 

Der von PRESSMAR entwickelte Planungsansatz beschreibt das dynamische Verhal- 
ten eines Systems mit Hilfe von diskreten Zustandsfunktionen. Hierbei ist ein 
System als eine strukturierte Anordnung von Elementen definiert, die sich einseitig 
oder gegenseitig beeinflussen. 91 

Jedes Element i des Systems besitzt eine diskrete Zustandsfunktion, die fur den be- 
trachteten Zeitraum die Art des Zustands und die Dauer des Zustands angibt. Die 
Zustandsdauer wird durch eine kontinuierliche Variable T tei abgebildet, wahrend 
der einzelne Zustand z iiber eine diskrete Grofie U^ definiert ist. Diese nimmt den 
Wert 1 an, wenn der Zustand z aktiv ist, und 0 sonst. 

Die Zustandswechsel jedes Systemelements werden mit Hilfe sogenannter 
Zustandstransformationsfunktionen abgebildet. Hierbei konnen zwei Arten von 
Zustandswechseln auftreten, und zwar ein Wechsel von Zustand z aktiv zu Zustand 
z inaktiv oder umgekehrt ein Wechsel von Zustand z inaktiv zu Zustand z aktiv. Im 
ersten Fall liegt eine Deaktivierung des Zustands z vor, die mit Hilfe einer logischen 
Variablen VD^ abgebildet wird 92 , und im zweiten Fall eine Aktivierung des 
Zustands z, zu deren Abbildung die Variable V^ eingefuhrt wird. 



90 Zum Problem der Periodendauer vgl. auch: Hilke, W.: Zur Lange des Planungszeitraumes in 
dynamischen Modellen, in: Jacob, H. (Hrsg.), Neue Aspekte der betrieblichen Planting, SzU, Bd. 
28, Wiesbaden 1980, S. 99-122, hier S. 102 

9 ^ Prefimar, D.B.: Produktions- und Ablaufplanung auf der Grundlage von diskreten Produktions- 
zustandsfunktionen, a.a.O., hier S. 138 

92 Im Gegensatz zum Planungsansatz von PRESSMAR wird hier in Anlehnung an BRUNS auch 
eine explizite Erfassung der Deaktivierung vorgenommen. Vgl. hierzu: Bruns, T.: Simultane In- 
vestitionsplanung auf der Grundlage einer expliziten Zeitabbildung, Gottingen 1990, S. 68 ff 
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2.5.5.I. Symbolverzeichnis 

Fur das dynamische Modell auf der Grundlage von diskreten Zustandsfunktionen 
werden folgende Indizes, Indexmengen, Variablen und Parameter benotigt: 93 

Indizes: 
m 
t 
z 
i 

Indexmengen: 

M = {l,...,m*} 

T = {l,...,t*} 

T m cT 

Z = {l,... / z*} 

I = {W*} 

kontinuierliche Variablen: 

Dauer des Systemelements i im Zustand z in der 
Periode t 

Pt Lange der Periode t 



Makroperioden 

Perioden 

Zustande 

Systemelemente 

Indexmenge der Makroperioden 
Indexmenge der Perioden 

Indexmenge der Perioden innerhalb der Makro- 
periode m 

Indexmenge der Zustande 
Indexmenge der Systemelemente 



diskrete Variablen: 



Utzi = 



1/ falls in Periode t fur Systemelement i der Zustand z aktiv ist 
0, sonst 



9 ^ Prefimar, D.B.: Modelling of Dynamic Systems by Linear Programming and its Application to 
the Optimization of Production Processes, a.a.O., hier S. 520 ff 
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1, falls von Periode t - 1 zu Periode t fur Systemelement i ein 

Zustandswechsel von Zustand z inaktiv zu Zustand z aktiv stattfindet 

0, sonst 



VD^ 



1, falls von Periode t - 1 zu Periode t fur Systemelement i ein 

Zustandswechsel von Zustand z aktiv zu Zustand z inaktiv stattfindet 

0, sonst 



Parameter: 

plp m Lange der Makroperiode m 

Dauer des Wechsels auf den Zustand z fur System- 
element i in der Makroperiode m 

2.5.5.2. Modellformulierung 

Jede Makroperiode wird in eine vorgegebene Zahl von Perioden unterteilt, wobei 
die Lange fur jede Makroperiode jeweils vorgegeben ist, wahrend die Periodenlan- 
gen Entscheidungsvariablen des Modells darstellen. Dieses macht eine Synchronisa- 
tion zwischen Makro- und Mikroperioden erforderlich. 

X p t =plPm V meM (2.11) 

tG T m 

Fiir jedes Element i des Systems darf die Dauer des Zustands z sowie die ggf. vorher 
fur den Wechsel auf den Zustand z benotigte Zeit nicht die Periodenlange iiber- 
schreiten. Die fiir den Zustandswechsel benotigte Zeit wird hierbei ausschliefilich 
der Aktivierung zugeordnet. 

X T tei + Xhn^i v tei < P t V me M, t6 T m , i 6 1 (2.12) 

ze Z zeZ 

Jeder Zustand z des Systems kann zu einem Zeitpunkt t nicht gleichzeitig aktiviert 
und deaktiviert werden. 

Vtzi + VD^j < 1 



V te T, zg Z, ie I 



(2.13) 
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Fur die Dauer eines Zustands z bestehen in Abhangigkeit von der Auspragung 
der diskreten Grofie U^j die folgenden zwei WENN-DANN-Bedingungen: 

- 1st ein Zustand z eines Systemelements i in einer Periode t nicht aktiv, ist die 
Zustandsdauer gleich 0. 

- Ist ein Zustand z eines Systemelements i in einer Periode t aktiv, darf die 
Zustandsdauer die Lange der zugehorigen Makroperiode m nicht iiberschreiten. 

Die Abbildung erfolgt fiber die Ungleichung 

T tzi ^ U tzi pipm V meM, teT m , ZeZ, iel (2.14) 

Wenn ein Zustand z in der Periode t aktiv ist, dann ist er entweder schon in der Pe- 
riode t-1 aktiv gewesen und wird auch nicht am Anfang der Periode t deaktiviert 
oder aber es findet am Anfang von Periode t ein Zustandswechsel auf den Zustand z 
statt. Wenn dagegen Zustand z in der Periode t nicht aktiv ist, dann ist er entweder 
in der Periode t-1 nicht aktiv gewesen und wird auch nicht am Anfang von Periode t 

aktiviert oder aber er ist in der Periode t-1 aktiv und wird am Anfang von Periode t 

deaktiviert. 

Diese beiden WENN-DANN-Beziehungen las sen sich durch eine Zustandstransfor- 
mationsfunktion abbilden. 

Vtzi-VDtzi-Utzi V teTmit t=l, zeZ, ie I 

Vtzi-VD tzi =U tzi -U t _ 1/Zi V te T mit t>l, ze Z, ie I (2.15) 

Es sind hierbei die in der Tabelle 1 dargestellten sechs verschiedenen Wertebelegun- 
gen moglich. 

Ein Zustandswechsel von Zustand z inaktiv zu Zustand z aktiv wird durch den Fall 
b erreicht. Der Fall c dagegen bildet einen Zustandswechsel von Zustand z aktiv zu 
Zustand z inaktiv ab. In den Fallen a und d findet kein Zustandswechsel statt und 
die Falle e und f konnen nicht auftreten, wenn gleichzeitig die Bedingung (2.13) 
gelten soil. 
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Fall 


Vtzi 


VD bi 


Utzi 


U t -l,zi 


a 


0 


0 


0 


0 


b 


1 


0 


1 


0 


c 


0 


1 


0 


1 


d 


0 


0 


1 


1 


e 


1 


1 


0 


0 


f 


1 


1 


1 


1 



Tabelle 1: Wertebelegungen einer Zustandstransformationsfunktion mit expliziter 

Beriicksichtigung der Deaktivierung 

Wenn die Deaktivierung eines Zustandes immer mit der Aktivierung eines neuen 
Zustandes verbunden ist, ist es ausreichend, nur die Aktivierung explizit iiber eine 
Variable abzubilden. Hierdurch fallt die Bedingung (2.13) weg und die Bedingung 
(2.15) andert sich wie folgt: 

V te T mit t=l, ze Z, ie I 

Vtzi - Utzi “U t _i /Z j V te T mit t>l, ze Z, ie I (2.16) 

Hier konnen jetzt die in der Tabelle 2 dargestellten vier Falle auftreten: 



Fall 


Utzi 


Ut-Ui 


Vtzi 


a 


0 


0 


0 oder 1 


b 


1 


0 


1 


c 


0 


1 


0 oder 1 


d 


1 


1 


0 oder 1 



Tabelle 2: Wertebelegungen einer Zustandstransformationsfunktion ohne Beriicksichti- 

gung der Deaktivierung 
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Der Fall b bildet einen Zustandswechsel ab. In alien anderen Fallen (a, c und d) wird 
die Auspragung der Variablen nur dann eindeutig gesteuert, wenn die Variable 
in Zusammenhang mit Zielvorstellungen gebracht wird. Es wird deshalb von der 
Annahme ausgegangen, dafi im Falle eines Zustandswechsels Kosten anfallen. 

Die bisherigen Bedingungen waren zur Abbildung des dynamischen Verhaltens 
notwendig. Es lassen sich dariiber hinaus jedoch noch weitere Bedingungen formu- 
lieren, die einen stark restriktiven Charakter beziiglich der moglichen Systemzu- 
stande besitzen. 

Darf innerhalb einer Periode nur genau ein Zustand der moglichen Zustande reali- 
siert werden, so lafit sich diese Ausschliefilichkeitsbedingung durch einen SOS1 
abbilden. 

X U tzi=l V teT,ieI (2.17) 

ze Z 



Das gleiche gilt fiir die Bedingung, dafi innerhalb des Planungszeitraums jeder 
Zustand hochstens einmal aktiviert und hochstens einmal deaktiviert werden darf. 



Iv tei <l 


V z e Z, i e I 


(2.18) 


teT 






XVD^l 


V z e Z, i e I 


(2.19) 


teT 







Im folgenden wird davon ausgegangen, dafi die Deaktivierung eines Zustandes im- 
mer mit der Aktivierung eines neuen Zustandes verbunden ist, so dal? die Modell- 
formulierung lediglich auf U- und V-Variablen basiert. Sie wird deshalb kurz als 
U/V-Formulierung bezeichnet. 



2.5.5.3. Alternative Modellformulierungen 

Fiir die Abbildung eines logischen Sachverhaltes existieren u.U. mehrere Moglich- 
keiten. Wird fiir die Abbildung des dynamischen Systemverhaltens statt der Zu- 
standsvariablen die Variable Y eingesetzt, die wie folgt definiert ist: 



1, falls in Periode t - 1 UND in Periode t fiir Systemelement i 
der Zustand z aktiv ist 

0, sonst 



dann lauten die entsprechenden Nebenbedingungen: 
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Ytzi=0 



V teTmit t=l, ie I, ze Z 



Y tzi ^ Y t-l,zi + V t -i,zi V te T mit t>l, ie I, ze Z (2.20) 

SYtzi+Vtzi=l V te T, ie I (2.21) 

ZG Z 



Die Nebenbedingung (2.14) andert sich wie folgt: 

Ttzi - ( Y tzi + V|zi ) plp m V me M, te T m , iG I, zg Z (2.22) 



Die eben beschriebene Modellformulierung weist noch eine relativ groEe Ahnlich- 
keit zur U/V-Formulierung auf. 

Wird nicht nur eine einzige Variable V zur Steuerung eines Zustandswechsels einge- 
fuhrt, sondern noch eine weitere Variable Y mit 



0, falls von Periode t - 1 zu Periode t fur Systemelement i ein 
Zustandswechsel von Zustand z inaktiv zu Zustand z aktiv stattfindet 

1, sonst 



ergibt sich gegeniiber der U/V-Formulierung eine dritte, stark geanderte Modell- 
variante. 

In dieser Formulierung, im folgenden als V/Y-Formulierung bezeichnet, wird zu- 
nachst davon ausgegangen, daE immer, wenn ein Zustand in einer Periode fur ein 
Systemelement aktiv ist, auch ein Zustandswechsel am Anfang der betrachteten Pe- 
riode stattgefunden hat. Fallt jedoch kein Zustandswechsel an, da schon in der Vor- 
periode der Zustand z aktiv war, werden die zuviel angesetzten Zeiten fur den Zu- 
standswechsel wieder subtrahiert. Die Steuerung erfolgt liber die Y-Variable. 

I T tei + X V tei - Y^i < P t V me M, te T m/ ie I (2.23) 

ZG Z zgZ zg Z 



In dem Falle, wo eine Variable Y ^ den Wert 1 annimmt, tritt eine Verminderung 
des Zeitbedarfs ein, so dafi die Variable immer versuchen wird, den Wert 1 anzu- 
nehmen. Aus diesem Grund muE durch die Modellformulierung erzwungen wer- 
den, daE fiir den Fall eines Zustandswechsels die entsprechende Variable Y^j den 
Wert 0 annimmt. 
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Die zugehorige Nebenbedingung lautet: 

V te T mit t=l, ie I, ze Z 

l-Y^ > V^i -V t _ 1/Zi V te T mit t>l, ie I, ze Z (2.24) 

1st der Zustand eines Systemelements i in der Periode t nicht aktiv, diirfen auch 
keine Zeiten fur einen Zustandswechsel subtrahiert werden, d.h. Y tei mufi ebenfalls 
wieder den Wert 0 annehmen. Diese einfache WENN-DANN-Beziehung wird durch 
die Nebenbedingung 

V tei > Y tei V te T, ie I, ze Z (2.25) 

abgebildet. 

Die Nebenbedingungen (2.14) und (2.17) lauten jetzt: 

T tzi ^ V tzi pipm V meM, te T m , iel, zgZ (2.26) 

E V tei =1 VteT,ieI (2.27) 

ze Z 



2.5.5.4. Losungsraume der verschiedenen Modellformulierungen 

Da die drei vorgestellten Modellformulierungen sich im wesentlichen durch die 
Bedingung fiir den Zustandswechsel unterscheiden und diese einen ganz entschei- 
denden EinfluB auf das zeitliche Losungsverhalten eines zur Berechnung verwende- 
ten Algorithmus besitzt, werden im folgenden die durch die Bedingung aufgespann- 
ten Losungsraume gegeniibergestellt. 

Fiir die U/V-Formulierung, bei der der Zustandswechsel durch die Bedingung 
(2.16) 

Vtzi^Ufcj “U t _i /Z i V teT mit t>l, zeZ, iel 

abgebildet wird, ergibt sich der in Abbildung 1 durch die dickeren Linien dargestell- 
te Losungsraum. 
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v t 




Abbildung 1: Losungsraum der Zustandswechselbedingung fiir die U/V-Formulierung 

Die Bedingung (2.20) fur den Zustandswechsel der ersten alternativen Modellfor- 
mulierung lautet umgeformt: 

V t -i,zi ^ Y tzi ~ Y t-l,zi V te T mit t>l, zg Z, ie I 

Da die Bedingung den gleichen Aufbau wie die Bedingung fiir den Zustandswech- 
sel bei der U/V-Formulierung aufweist, sind, wie die Abbildung 2 auch zeigt, die 
Losungsraume gleich. 



V t -1 




Abbildung 2: Losungsraum der Zustandswechselbedingung fiir die erste alternative 

Modellformulierung 
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Bei der V/Y-Formulierung sind zur Abbildung des Zustandswechsels die beiden 
Bedingungen (2.24) und (2.25) 

1- Y^i > V^i - V t _i /Z i V tG T mit t>l, ie I, ze Z 

V^^Y^ V tG T, ie I, zg Z 

notwendig. In der Abbildung 3 ist in der linken Abbildung der Losungsraum der 
ersten Bedingung dargestellt und in der rechten Abbildung der Losungsraum der 
zweiten Bedingung. 94 Der Schnitt aus beiden Losungsraumen entspricht dann dem 
Losungsraum fur beide Bedingungen. 

Insgesamt zeigt sich also, daB bei der U/V-Formulierung und der ersten altemativen 
Modellformulierung die Losungsraume fiir die Zustandswechselbedingung die 
gleiche GroBe aufweisen und relativ groB sind, da von dem Einheitsquader nur eine 
kleine Ecke abgeschnitten wird. Bei der V/Y-Formulierung dagegen ist der 
Losungsraum gegeniiber den anderen beiden Modellformulierungen deutlich 
kleiner. 




Abbildung 3: Losungsraume der Zustandswechselbedingungen fiir die V/Y-Formulierung 



94 Die Losungsraume werden aus Griinden der Ubersichtlichkeit getrennt dargestellt. 
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2.5.5.5. Beriicksichtigung reihenfolgeabhangiger Zustandswechselzeiten 

In der betriebswirtschaftlichen Praxis sind die Zustandswechselzeiten haufig reihen- 
folgeabhangig. Allerdings sind sie in diesem Fall nicht zwangslaufig fiir jeden Zu- 
standswechsel unterschiedlich. Vielmehr fallen u.U. fiir zahlreiche Zustandswechsel 
von z nach z' die gleichen Zeiten an. 

In der Tabelle 3 findet sich ein entsprechendes Beispiel. Hierbei zeigen die umrande- 
ten Felder Blocke mit jeweils gleichen Zustandswechselzeiten. 



von \ nach 
Zustand 


1 


2 


3 


4 


5 


6 


1 


- 


1.5 


0.5 


0.5 


1.5 


1.5 


2 


1.5 


- 


1.5 


1.5 


1.5 


2 


3 


1.5 


1.5 


- 


1.5 


1.5 


2 


4 


2.5 


2.5 


1.5 


- 


1.5 


2 


5 


2.5 


2.5 


1.5 


1.5 


- 


1.5 


6 


1.5 


1.5 


1.5 


1.5 


1.5 


- 



Tabelle 3: Reihenfolgeabhangige Zustandswechselzeiten 

Fiir diejenigen Zustandswechsel, die nicht in einen der Blocke fallen, werden die 
Zustandswechselzeiten als reihenfolgeunabhangig angenommen. Fiir diejenigen 
Zustandswechsel dagegen, die in einen der Blocke fallen, werden die als reihenfol- 
geunabhangig definierten Zeiten angesetzt und fiir jeden Block individuell noch rei- 
henfolgeabhangige Zeiten. Diese berechnen sich als Differenz zwischen den tatsach- 
lichen reihenfolgeabhangigen Zeiten und den schon angesetzten reihenfolgeunab- 
hangigen Zeiten. Der Differenzbetrag kann sowohl positiv als auch negativ sein, je 
nachdem, ob die tatsachlichen reihenfolgeabhangigen Zeiten kleiner oder grofier als 
die beriicksichtigten reihenfolgeunabhangigen Zeiten sind. 

Die Beriicksichtigung reihenfolgeabhangiger Zustandswechselzeiten wird fiir die 
U/V-Formulierung und die V/Y-Formulierung vorgestellt. 

Der reihenfolgeunabhangige Zustandswechsel wird bei der U/V-Formulierung, wie 
bisher, durch die V- Variable gesteuert. Zur Abbildung des reihenfolgeabhangigen 
Zustandswechsels, des sogenannten Blockzustandswechsels, wird fiir jeden Block 
eine R- Variable eingefiihrt. 
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1, falls in Periode t auf Systemelement i der Blockzustandswechsel r 
mit positiver Differenz stattfindet 

0, sonst 



R «r 



1, falls in Periode t auf Systemelement i der Blockzustandswechsel r 
mit negativer Differenz stattfindet 



0, sonst 



wobei 



r 


Blockzustandswechsel 


R + = 


Indexmenge der Blockzustandswechsel mit positiver 
Differenz 


R- = (1 r*} 


Indexmenge der Blockzustandswechsel mit negati- 
ver Differenz 


Zu jedem Blockzustandswechsel existieren zwei weitere Indexmengen. Sie geben an, 
von welchen Zustanden (Von-Zustande) auf welche Zustande (Nach-Zustande) der 
reihenfolgeabhangige Zustandswechsel beriicksichtigt werden mufi. 


V 


Von-Zustande 


n 


Nach-Zustande 


v r = (l,...,v*} 


Indexmenge der Von-Zustande des Blockzustands- 
wechsels r 


N r = {1 n*) 


Indexmenge der Nach-Zustande des Blockzu- 
standswechsels r 



Die Blockzustandswechsel sind hierbei derart zu definieren, dafi V r nN r = 0 gilt. 

Wenn in einer Periode t-1 ein Von-Zustand eines Blockzustandswechsels r aktiv ist 
und in Periode t ein Zustandswechsel auf einen Nach-Zustand des Blockzustands- 
wechsels r stattfindet, dann miissen zusatzlich zu den reihenfolgeunabhangigen Zu- 
standswechselzeiten auch die reihenfolgeabhangigen Zeiten des Blockzustands- 
wechsels r beriicksichtigt werden. Ist hierbei die Differenz zwischen den tatsachli- 
chen reihenfolgeabhangigen Zeiten und den als reihenfolgeunabhangig definierten 
Zeiten positiv, so miissen noch zusatzlich Zeiten beriicksichtigt werden. Es mufi da- 
her noch folgende Nebenbedingung zum Modell hinzugefiigt werden: 
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R y r — X V tni+ XU t _ 1/Vi -1.0 V t 6 Tmitt>l,i e I,r 6 R + (2.28) 

neN r veV r 

1st die Differenz dagegen negativ, sind zuviel Zeiten angesetzt worden, die wieder 
abgezogen werden mussen. In diesem Fall mufi die R-Variable auf den Wert 0 
gezwungen werden, wenn kein Blockzustandswechsel stattfindet: 

Xu t _i /Vi >R^ r VteTmittxL, 

VG V r 

ve V r , iG I, re R_ (2.29) 

XVtni^Rfe V teT, neN r , iel, reR_ (2.30) 

ne N r 

Die reihenfolgeabhangigen Zustandswechselzeiten mussen des weiteren in der 
Sync±ironisationsbedingung (2.12) Berucksichtigung finden. Sie lautet daher: 

+ 5Lhmzi V tei + ^hb m j r R^ r — ^hbfj^j. R tir ^ Pt 
zgZ zgZ reR + reR_ 



V mGM,tGT m ,iGl (2.31) 



wobei 

hbj^j. [ZE] Zustandswechselzeit, die in der Makroperiode m auf 

dem Systemelement i beim Zustandswechsel von 
einem Von-Zustand auf einen Nach-Zustand des 
Blockzustandswechsels r anfallt 95 

Fur die V/Y-Formulierung lauten die entsprechenden Nebenbedingungen bei posi- 
tiver Differenz: 

R tjr ~ Z v tni+ X V t _ 1(Vi - X Y tni-10 V tETmitt>l / ieI,rER + (2.32) 
nGN r vg V r nGN r 



95 Die Zeit stellt die Differenz zwischen der als reihenfolgeunabhangig angenommenen Zustands- 
wechselzeit und der tatsachlichen Zustandswechselzeit dar, wobei der Differenzbetrag absolut 
angesetzt wird. 




38 



und bei negativer Differenz: 

X V t - 1/Vi ^ R a r V te T mit i>lf le lf rG R - (2 33) 

ve V r 

SVtni^R^ (2.34) 

ne N r 

Die Synchronisationsbedingung muF analog zu oben erweitert werden: 

X ^tzi + X ^mzi Vtzi - X^rnzi ^tzi + X^mir R tir ~ X^mir R tir “ R t 

ze Z zgZ zgZ reR + tgR_ 

V meM,teT m/ ieI (2.35) 



2.5.6. Das Produktionsplanungsmodell mit Zielsetzung Gewinnmaximierung 
2.5.6.I. Problemstellung 

Die aus Griinden der Ubersichtlichkeit vereinfachte Problemstellung lautet wie folgt: 

Es werden verschiedene Produktarten jeweils in einem mehrstufigen linearen Ferti- 
gungsprozefi 96 in offener Fertigungsweise 97 hergestellt. Fiir die Produktion stehen 
mehrere Produktionsanlagen zur Verfiigung, die in der Lage sind, verschiedene 
Produktarten auf unterschiedlichen Produktionsstufen zu fertigen, jedoch nicht 



9 ^ Bei mehrstufiger Fertigung kann der Fertigungsprozefi linear Oder vemetzt sein. Von einem 
linearen Fertigungsprozefi wird gesprochen, wenn jedes Zwischen- oder Endprodukt hochstens 
einen Vorganger und hochstens einen Nachfolger besitzt. Ein vemetzter Fertigungsp rozefi ist 
gegeben, wenn Zwischen- oder Endprodukte aus mehreren Vorprodukten zusammengesetzt 
werden. Dieses ist bei Montage- oder Mischungsprozessen der Fall. Desweiteren fiihrt auch die 
Parallelproduktion identischer Produkte auf mehreren Aggregaten zu einer vemetzten Ferti- 
gungsstruktur. Vgl. hierzu z.B.: Kurbel, K.: a.a.O., S. 19 ff 

97 Im Rahmen der Produktionsplanung wird zwischen offener und geschlossener Fertigungsweise 
unterschieden. Geschlossene Produktion bedeutet, dafi die einzelnen Mengeneinheiten eines 
Loses erst dann weiterverarbeitet werden konnen, wenn das Los vollstandig hergestellt ist. Als 
Los wird hierbei diejenige Menge einer Produktart bezeichnet, die hintereinander, also ohne 
Umstellung auf eine andere Produktart oder Produktionsstufe, auf einer Produktionsanlage 
gefertigt wird. Bei der offenen Fertigungsweise dagegen konnen die einzelnen Mengeneinheiten 
eines Loses sofort nach ihrer Fertigstellung weiterverarbeitet werden. Vgl. hierzu z.B.: Kurbel, 
K.: a.a.O., S. 10, S. 41 
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intensitatsmafiig anpafibar sind 98 Ein Aufteilungsproblem tritt damit nur in Form 
funktionsgleicher, aber kostenverschiedener Produktionsanlagen auf. 

Die Zwischenprodukte konnen nicht abgesetzt werden. Sie miissen in voller Hohe - 
Ausschufi fallt bei der Fertigung nicht an - zwischengelagert werden. Lagerbe- 
schrankungen liegen nicht vor. 

Es existieren Absatzmindest- und Absatzhochstgrenzen. Verzugs- und Fehlmengen 
werden jedoch nicht beriicksichtigt. 99 

Wechselt eine Produktionsanlage die Produktionsstufe und/oder das Produkt, ist 
eine Umriistung erforderlich, bei der Ausfallzeiten in Form von Umriistzeiten ent- 
stehen, die neben der Kapazitatsminderung auch noch Umriistkosten verursachen. 
Sowohl Umriistzeiten als auch Umriistkosten sollen zunachst reihenfolgeunabhangig 
sein. Der Fall reihenfolgeabhangiger Zeiten und Kosten wird spater im Abschnitt 
2.5.6 A. betrachtet. 

Der gesamte Komplex des Kapitalflusses und der Kapitalbindung wird nicht 
beriicksichtigt. 100 

Neben der Planung des zeitlichen Vollzugs ist auch die Planting des Produktions- 
programms zu realisieren. Als Zielsetzung wird zunachst Gewinnmaximierung 
angesetzt. Gemafi der skizzierten Problemstellung sind hierbei neben den 
Verkaufserlosen der Endprodukte Produktions-, Beschaffungs-, Lager- und Umriist- 
kosten zu beriicksichtigen. Anhand einer leicht geanderten Problemstellung wird 
anschliefiend ein Modell mit der zeitbezogenen Zielsetzung Durchlaufzeitmini- 
mierung betrachtet. 



98 Der Fall unterschiedlicher Intensity ten wird z.B. betrachtet in: Prefimar, D.B.: Evolutorische und 
stationare Modelle mit variablen Zeitintervallen zur simultanen Produktions- und Ablauf- 
planung, a.a.O.; Prefimar, D.B.: Zur optimalen Bestimmung einer nichtstationaren Losgrofien- 
politik unter Beriicksichtigung von Verzugsmengenkosten, a.a.O. 

99 Zur Beriicksichtigung von Verzugsmengen vgl.: Prefimar, D.B.: Zur optimalen Bestimmung 
einer nichtstationaren Losgrofienpolitik unter Beriicksichtigung von Verzugsmengen kosten, 
a.a.O. 

100 Q er Kapitalflufi findet z.B. Beriicksichtigung in: Prefimar, D.B.: Zur optimalen Bestimmung einer 
nichtstationaren Losgrofienpolitik unter Beriicksichtigung von Verzugsmengenkosten, a.a.O. 
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2.5.6.2. Symbolverzeichnis 

Zur Formulierung des Modells werden folgende Symbole benotigt: 



Indizes: 

m 

t 

z 

s 



Makroperioden 

Perioden 

Produkte 

Produktionsstufen 

Produktionsanlagen 



Indexmengen: 
M = {l,...,!!!*} 

T = {1,.../} 

T m = T 

Z = {1 z*) 

Z s c Z 

Zi cZ 

S = {l,..,s*} 
S z cS 

SicS 

I = {W*} 

I z cl 

I s cl 



Indexmenge der Makroperioden innerhalb des Pla- 
nungszeitraums 

Indexmenge der Entscheidungszeitpunkte und Peri- 
oden innerhalb des Planungszeitraums 

Indexmenge der Entscheidungszeitpunkte und Peri- 
oden innerhalb der Makroperiode m 

Indexmenge der Produkte 

Indexmenge der Produkte, die die Produktionsstufe 
s durchlaufen miissen 

Indexmenge der Produkte, die auf der Produktions- 
anlage i gefertigt werden konnen 

Indexmenge der Produktionsstufen 

Indexmenge der Stufen, in denen das Produkt z 
gefertigt werden mufi 

Indexmenge der Stufen, auf denen die Produktions- 
anlage i fertigen kann 

Indexmenge der Produktionsanlagen 

Indexmenge der Produktionsanlagen, auf denen das 
Produkt z gefertigt werden kann 

Indexmenge der Produktionsanlagen, die auf der 
Produktionsstufe s fertigen konnen 
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Binarvariablen: 

1, falls in der Periode t die Produktionsanlage i fur die Fertigung des 
Produktes z in der Produktionsstufe s zur Verfiigung steht 

Utzsi = 

0, sonst 




falls am Anfang von Periode t auf der Produktionsanlage i eine 
Umriistung auf den Zustand zs stattfindet 

sonst 



kontinuierliche Variablen: 

T tzsi [ZE] Fertigungszeit des in der Periode t auf der Produkti- 

onsanlage i in der Produktionsstufe s hergestellten 
Produktes z 

L tzs [ME] Lagerbestand des Produktes z nach der Produkti- 

onsstufe s am Ende von Periode t 

P t [ZE] Lange der Periode t 



Parameter: 

p!Pm 

P ls t 

x mzsi 



hmzsi 



amm mz 



[ZE] Lange der Makroperiode m 

[ZE] geschatzte Lange der Periode t 

[ME/ZE] Menge des Produktes z, die pro ZE in der Makro- 
periode m auf einer Produktionsanlage i in der 
Produktionsstufe s hergestellt werden kann 
(Produktionskoeffizient) 

[ZE] Umrustzeit, die anfallt, wenn in der Makroperiode 
m die Produktionsanlage i fur die Fertigung des 
Produktes z auf der Produktionsstufe s umgeriistet 
wird 

[ME] Absatzmindestmenge von Endprodukt z in der 
Makroperiode m 
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amax mz [ME] 

Lozs [ME] 

kmzsi [GE/ZE] 

r ^mzsi [GE] 

Ikmzs [GE/(ME*ZE)] 
Pmz [GE/ME] 

qinz [GE/ME] 



Absatzhochstmenge von Endprodukt z in der 
Makroperiode m 

Lageranfangsbestand von Produkt z auf der 
Produktionsstufe s 

Produktionskosten, die pro ZE in der Makroperiode 
m bei der Fertigung des Produktes z in der Produk- 
tionsstufe s auf der Produktionsanlage i anfallen 

Umriistkosten, die anfallen, wenn in der Makro- 
periode m die Produktionsanlage i fur die Fertigung 
des Produktes z auf der Produktionsstufe s umge- 
riistet wird 

Lagerkostensatz des Produktes z fur die Produkti- 
onsstufe s in der Makroperiode m 

Verkaufspreis des Endproduktes z in der Makro- 
periode m 

Rohmaterialpreis fur das Produkt z in der Makro- 
periode m 



Dimensionen: 

ZE 

ME 

GE 



Zeiteinheiten 

Mengeneinheiten 

Geldeinheiten 



2.5.6.3. Modellformulierung 

Zur Abbildung des dynamischen Verhaltens im Rahmen der Produktionsplanung 
wird die U/V-Formulierung herangezogen. 101 

Die Elemente des Systems sind durch die Produktionsanlagen gegeben. Die diskre- 
ten Zustande einer Produktionsanlage werden durch zwei Indizes bestimmt, und 
zwar das Produkt z und die Produktionsstufe s. Ein Zustand zs ist auf einer 
Produktionsanlage i aktiv, wenn die Anlage fur die Produktion von Produkt z auf 



101 Eine Abbildung auf der Grundlage der V/Y-Formulierung lafit sich leicht erzielen, wenn die 
entsprechenden Nebenbedingungen ausgetauscht bzw. modifiziert werden. 
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der Produktionsstufe s bereit ist. Ein Zustandswechsel bedeutet eine Umriistung von 
einem Zustand zs auf einen Zustand z's, zs' oder z's'. Statt fiir die Fertigung des 
Produktes z auf der Stufe s steht die Anlage dann fiir die Fertigung eines anderen 
Produktes z' und/oder fiir die Fertigung auf einer anderen Produktionsstufe s' zur 
Verfiigung. 

Die zeitliche Synchronisation des dynamischen Produktionssystems laEt sich analog 
zum allgemeinen Modell formulieren. 

X p t=P 1 Pm Vm e M (2.36) 

Die Fertigungszeit eines Zustandes zs darf nicht langer sein als die Periodenlange 
abziiglich einer eventuellen Umriistzeit fiir die Umriistung auf den Zustand zs. 

X ^tzsi + ^^mzsi ^tzsi - V me M, te T m , ie I (2.37) 

zeZj zeZi 

seS z nSj seS z nSi 

Eine Produktions anlage steht gleichzeitig nur fiir die Fertigung einer Produktart auf 
einer Produktionsstufe zur Verfiigung, so dafi die gleichzeitige Fertigung mehrerer 
Produkte und die gleichzeitige Fertigung in unterschiedlichen Produktionsstufen 
nicht moglich ist. 

X u tzsi=l V te T, ie I (2.38) 

ze Z[ 
se S z nSi 

Steht in einer Periode eine Produktionsanlage fiir die Fertigung eines Produktes z in 
einer Produktionsstufe s bereit, darf die Fertigungszeit eine vorgegebene Ober- 
grenze, i.a. die entsprechende Makroperiodenlange, nicht iiberschreiten. Steht die 
Produktionsanlage fiir die Fertigung nicht bereit, mufi die Fertigungszeit 0 sein. 

^tzsi — ^tzsi P^Pm V me M, te T m , ze Z Y (2.39) 

Se S z nSj, ie I 

Die in einer Periode fiir die Fertigung des Produktes z auf der Produktionsstufe s 
zur Verfiigung stehende Zeit einer Produktionsanlage verringert sich, wenn auf der 
Anlage in der Vorperiode ein anderes Produkt und/oder auf einer anderen Produk- 
tionsstufe gefertigt worden ist. In diesem Fall mufi eine Umriistung durchgefiihrt 
werden. Der Umriistvorgang lafit sich durch eine Zustandstransformationsfunktion 
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abbilden. Da jede Deaktivierung eines Zustands zu einer Aktivierung eines anderen 
Zustands fiihrt, mufi hier lediglich die Aktivierung explizit abgebildet werden. 

^tzsi — ^tzsi V te T mit t=l, 

zg Zj, s £ S z nSj, i£ I 



^tzsi — ^tzsi ^t— l,zsi ^ t£ T mit t>l, (2.40) 

z £ 'Ly s £ S z nSj, i£ I 

Fiir die einzelnen Produkte bestehen sowohl Absatzmindest- als auch Absatz- 
hochstgrenzen. 

y, x mzs*i ^tzs^i - ^ ^^mz ^ m£ M, Z£ Z (2.41) 

teT m 

i£l z nl s * 

^L x mzs*i ^tzs^i — 3inax mz V m£M,Z£Z (2.42) 

te T m 
i£l z nl s * 



Im Zusammenhang mit der Lagerwirtschaft sind Mengenkontinuitatsbedingungen 
zu beachten. Der Lagerbestand in einer Periode zuzuglich der Produktionsmenge 
der Periode eines Produktes mufi grofier sein als der Lagerbestand der Folgeperiode 
zuzuglich der Produktionsmenge des betrachteten Produktes in der nachsten Pro- 
duktionsstufe. Ein Lagerabgang von Zwischenprodukten mufi nicht beriicksichtigt 
werden, da nur die Endprodukte absatzfahig sind. 

L tzs + x mz,s+l,i ^tz,s+l,i - ^t-l,zs ^ m£ M, t£ T m mit t=l 

i£l z nl s+ i 

Z£ Z, S£ S z mit s<s* 

L tzs + 2j X mz,s+l / i Tt Z/ s+l,i - Lt-l,zs + 5u X mzsi ^t-Lzsi 

i£ I Z n Is+l ielz nl s 



V m£ M, t£ T m mit t>l, Z£ Z, S£ S z mit s<s* (2.43) 
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Die Zielfunktion lautet: 102 

XtPmz x mzs*i “ ^mzs*i ] ^tzs*i Erlose und Produktionskosten der Stufe 8=8* 

mtzi 

y km 7< ii T tzs i Produktionskosten der Stufen l<s<s* 

mtz 

l<s<s* 

i 

I[ qmz x M li “ kmzli ] Beschaffungs- und Produktionskosten der Stufe s=l 

mtzi 

^0.51k mzs pls t (L t _j zs +L tzs ) Lagerkosten 

mtz 

s<s* 

X rk mzsi V tzsi Umriistkosten 

mtzsi 



= max ! (2.44) 

Zur Quantifizierung der Lagerkosten wird i.a. der durchschnittliche Lagerbestand 
mit der Lagerdauer multipliziert. Da in dem dynamischen Modell sowohl der 
Lagerbestand als auch die Lagerdauer variable Grofien sind, ergibt sich ein nicht- 
linearer Term. Mit Hilfe eines Schatzwertes fiir die Lagerdauer ist eine Linearisie- 
rung moglich. 

0.5 lkj^s pls t (L t _! ,zs ^tzs) (2.45) 

Der dadurch verursachte Approximationsfehler ist im Vergleich zu den anderen 
Komponenten der Zielfunktion gering, so dafi die Genauigkeit in der Praxis ausrei- 
chend ist. 103 



102 py r ^j e Laufindizes bei der Summenbildung wird aus Griinden der Ubersichtlichkeit eine ver- 
einfachte Darstellung gewahlt. 

103 Prefimar, D.B.: Zur optimalen Bestimmung einer nichtstationaren Losgrofienpolitik unter Be- 
riicksichtigung von Verzugsmengenkosten, a.a.O., hier S. 618 f 
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2.5.6.4. Beriicksichtigung reihenfolgeabhangiger Umriistkosten und -zeiten 

Im Rahmen der Produktionsplanung fallt der Blockzustandswechsel in Form einer 
Blockumrustung an. Genau wie zuvor verandern sich die Synchronisationsbedin- 
gungen (2.31) und (2.35) sowie die Blockzustandswechselbedingungen (2.28) - (2.30) 
bzw. (2.32) - (2.34) fur die U/V- und die V/Y-Formulierung im Falle einer mehrstu- 
figen Fertigungsweise nur insofern, als daB ein Zustand immer durch das Produkt z 
und die Produktionsstufe s, auf der das Produkt gefertigt wird, gekennzeichnet ist. 

Da im allgemeinen nicht nur die Umriistzeiten reihenfolgeabhangig sind, sondern 
auch die Umriistkosten, erweitert sich ferner die Zielfunktion (2.44) bei beiden 
Modellformulierungen um den Term 

X brk mir R Jir- Z brk mir R Hr (2-46) 

me M,te T m 
ie I, re R_ 

[GE] Umriistkosten, die in der Makroperiode m auf einer 
Produktionsanlage i bei der Umriistung von einem 
Von-Zustand auf einen Nach-Zustand der 
Blockumrustung r anfallen 

2.5.7. Das Produktionsplanungsmodell mit Zielsetzung Durchlaufzeitminimie- 
rung 

2.5.7.1. Problemstellung 

Neben der erlos- und kostenorientierten Zielsetzung soli im folgenden eine zeitori- 
entierte Zielsetzung mit einer leichten Anderung der Problemstellung betrachtet 
werden. 

Statt einer offenen Fertigungsweise liegt jetzt eine geschlossene Fertigungsweise vor, 
bei der jedes Los nur genau einmal aufgelegt werden darf. 

Als zeitorientierte Zielsetzung wird die Minimierung der Durchlaufzeit angesetzt. 

2.5.7.2. Modellformulierung 

Das Modell bei Durchlaufzeitminimierung wird fur die U/V-Formulierung vorge- 
stellt. Flierbei bleiben die Synchronisationsbedingungen (2.36) und (2.37) fur die 
Makro- und die Mikroperioden sowie die Umrustungsbedingung (2.40) unveran- 
dert. 



me M,te T m 
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In der Aussc±iliefilic±ikeitsbedingung mufi neben dem Tatbestand, dafi die gleichzei- 
tige Fertigung mehrerer Produkte und die gleichzeitige Fertigung in unterschiedli- 
chen Produktionsstufen nicht moglich ist, noch beriicksic±itigt werden, dafi produk- 
tionsbedingte Leerzeiten auftreten konnen. Hierfiir wird die Binarvariable U^Qi ein- 
gefiihrt: 



U t00i = 



1, falls Produktionsanlage i in Periode t eine produktionsbedingte 
Leerzeit hat 



0, sonst 



Die Ausschliefilichkeitsbedingung lautet dann: 

X U tzsi+U t0 Oi =1 Vt 6 T,UI (2.47) 

ZG Z[ 
sg S z nSi 



Aufgrund der geschlossenen Fertigungsweise mufi gewahrleistet werden, dafi 
innerhalb einer Periode ein Produkt nicht gleichzeitig auf zwei verschiedenen 
Produktionsanlagen in verschiedenen Produktionsstufen gefertigt wird. 

£u tzsi <l V teT, zeZ (2.48) 

sgS z 

iGl z nI s 



Im Zusammenhang mit der Lagerwirtschaft sind jetzt zwei Mengenkontinuitatsbe- 
dingungen zu beachten. Wird in zwei aufeinanderfolgenden Perioden ein Produkt 
in der gleichen Produktionsstufe bearbeitet, so lautet die Bedingung: 



^tzs — ^t-l,zs + 5L x mzsi ^tzsi 



iGl z nI s 



V IHg M, tG T m , Zg Z, 



Sg S 



z 



(2.49) 



Wird das Produkt dagegen in der Folgeperiode auf der nachsten Produktionsstufe 
gefertigt, mufi gelten: 

^tzs + ^ x mz,s+l,i ^tz^+hi - ^t-l,zs ^ me M, tG T m , Zg Z, 

iG I z nl s+ j 



sg S 7 mit s<s’ 



(2.50) 
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Die Forderung nach hochstens einmaliger Losauflage entspricht der Forderung nach 
hochstens einmaliger Umriistung. 

X v tzsi<l VzeZ,seS z (2.51) 

teT 

iel z nl s 

Die Zielfunktion lautet: 

^P t =min! (2.52) 

teT 

Da in die Zielfunktion im Gegensatz zum Modell mit Gewinnmaximierung nur die 
Mikroperiodenlange eingeht, wird sie durch die verschiedenen Modellformulierun- 
gen nicht beeinflufit. 

2.6. Zusammenfassung 

Unter dem Gesichtspunkt der Komplexitatsbewaltigung betriebswirtschaftlicher 
Entscheidungsprobleme sind im Zusammenhang mit der Modellformulierung ver- 
schiedene Mafinahmen zunachst anhand eines allgemeinen dynamischen Planungs- 
modells aufgezeigt worden und anschliefiend auf die Problemstellung der Produkti- 
onsplanung angewandt worden. Im einzelnen handelte es sich hierbei um: 

- die Formulierung des allgemeinen dynamischen Modells auf der Basis einer 
variablen Zeitrasterung, 

- alternative Modellformulierungen fiir das dynamische Modell sowie 

- die Beriicksichtigung von reihenfolgeabhangigen Zustandswechselzeiten in Form 
von Blockzustandswechseln. 

Nachdem als nachstes im dritten Kapitel eine Beschreibung der Parallelverarbeitung 
und der hierfiir entwickelten Parallelrechnerarchitekturen erfolgt, werden im Kapi- 
tel 4 algorithmische Verfahrensvarianten vorgestellt, die ebenfalls zu einer Kom- 
plexitatsbewaltigung fiihren sollen. 




3. Grundlagen der Parallelverarbeitung 

3.1. Begriffsdefinitionen 

Par allele Verarbeitung bzw. Parallelverarbeitung ist eine effiziente Form der Infor- 
mationsverarbeitung, bei der die gleichzeitige Bearbeitung im Vordergrund steht. 
Sie ist auf verschiedenen Ebenen moglich . 104 

Bei einer parallelen Verarbeitung auf der Programmebene eines ED V-Sy stems wer- 
den gleichzeitig mehrere Benutzerprogramme bearbeitet. Die Steuerung erfolgt zu- 
meist durch das Betriebssystem, so dafi der Benutzer nicht eingreifen mufi. Werden 
zwar nicht ganze Programme, aber einzelne Prozeduren eines Programms gleichzei- 
tig bearbeitet, liegt parallele Verarbeitung auf der Prozedurebene vor. Sie ist durch 
das Auftreten von explizitem Parallelismus gekennzeichnet. Expliziter Parallelismus 
bedeutet, dafi die Teile eines Programms, die gleichzeitig bearbeitet werden konnen, 
durch den Benutzer explizit gekennzeichnet werden mussen. Demgegeniiber liegt 
im Falle einer parallelen Verarbeitung auf der Anweisungsebene, bei der nur einzel- 
ne Anweisungen, wie z.B. die Anweisungen innerhalb einer DO-Schleife, gleichzei- 
tig ausgefiihrt werden, zumeist impliziter Parallelismus vor. Er wird i.a. durch einen 
sogenannten Parallelcompiler erkannt, so dafi der Benutzer die gleichzeitig ausfiihr- 
baren Anweisungen nicht explizit angeben mufi. Daneben besteht jedoch auch die 
Moglichkeit, dafi von seiten des Benutzers eine explizite Kennzeichnung vorge- 
nommen wird. Auf der untersten Ebene, der parallelen Verarbeitung auf der Opera- 
tionsebene, werden lediglich Elementaroperationen gleichzeitig ausgefiihrt. Das 
Erkennen erfolgt hier ausschliefilich durch einen Compiler . 105 

Fur die parallele Verarbeitung sind spezielle Parallelrechner entwickelt worden 106 . 
Bevor jedoch die verschiedenen Formen vorgestellt werden, soli zunachst ein 
Uberblick iiber die geschichtliche Entwicklung von Rechnern allgemein gegeben 
werden. 

3.2. Geschichtliche Entwicklung 

Die Entwicklung von Rechnern ist durch eine immer hohere Leistungsfahigkeit der 
Fiardwarekomponenten und eine zunehmende Einfiihrung von Parallelismus in die 



104 Hwang, K., Briggs, F.A.: Computer architecture and parallel processing. New York 1984, S. 6 f 

105 Giloi, W.K.: Rechnerarchitekturen, Berlin Heidelberg 1981, S. 113 f; Hwang, K., Briggs, F.A.: 
a.a.O., S. 7 

106 Hwang, K., Briggs, F.A.: a.a.O., S. 20; Quinn, M.J.: Designing efficient algorithms for parallel 
computers, New York 1987, S. 13 
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Rechnerarchitektur gekennzeichnet. Von der Entwicklung des ersten Analogrechners 
1938 und des ersten Digitalrechners 1946 bis heute lassen sich anhand der eingesetz- 
ten Hardwarekomponenten und des realisierten Grades an Parallelismus vier Gene- 
rationen von Rechnern feststellen. 107 Jede Generation weist hierbei mindestens 
einen, i.a. besonders erfolgreichen, Rechner auf, der fiir die jeweilige Generation 
richtungsweisend war. 

Fiir die erste Generation von Rechnern (1938-1953) ist der Einsatz von elektrome- 
chanischen Relais oder Vakuumrohren als Umschaltkomponenten und eine aus- 
schlieBlich serielle Verarbeitung charakteristisch. Zum einen konnten samtliche 
Operationen, wie Speicherzugriffe, logische und arithmetische oder Ein- und Aus- 
gabeoperationen, nur sequentiell ausgefiihrt werden, da ein Rechner nur aus einer 
Ein- und Ausgabeeinheit, einem Hauptspeicher zur Speicherung der Daten und 
Instruktionen, einer Kontrolleinheit zur Interpretation der Instruktionen sowie einer 
einzigen arithmetischen und logischen Einheit zur Bearbeitung der Daten bestand. 
Zum anderen konnten die Speicherzugriffe und die Arithmetik nur bit-seriell erfol- 
gen, d.h. zur gleichen Zeit konnte nur jeweils ein Bit aus dem Speicher gelesen und 
anschliefiend verarbeitet werden. Die Schaltzeiten waren mit 1 ps 108 entsprechend 
langsam. Bekannte Rechner dieser Generation sind der an der Universitat von 
Cambridge entwickelte EDSAC und der an der Universitat von Pennsylvania ent- 
wickelte ED VAC. 

In der zweiten Generation (1952-1963) wurden Transistoren eingesetzt. Gleichzeitig 
begann mit dem Einfiihren eines bit-parallelen Speichers und einer bit-parallelen 
Arithmetik bei der IBM 701 und der Entwicklung eines I/O-Kanals bei der IBM 709 
die Einfiihrung von Parallelismus in die Hardwarearchitektur. Der I/O-Kanal 
ermoglichte es erstmals, arithmetische und logische Operationen parallel zur Ein- 
und Ausgabe von Daten durchzufiihren. Die Schaltzeiten sanken damit bis auf 0.3 
ps. 

Die Rechner der dritten Generation (1962-1975) waren schnelle skalare Rechner. Der 
Einsatz von small-scale integrierten (SSI) und medium-scale integrierten (MSI) 
Schaltkreisen senkte die Schaltzeiten erheblich. Das Einfiihren von mehreren Einhei- 
ten fiir die unterschiedlichen arithmetischen und logischen Operationen und die 
Aufteilung des Speichers in mehrere Module, auf die unabhangig voneinander 
zugegriffen werden konnte, fiihrten zum grofien Erfolg des Computersystems CDC 



^ 7 Die Einteilung in Generationen basiert im wesentlichen auf der Einteilung von HWANG und 
BRIGGS. Vgl. hierzu: Hwang, K., Briggs, F.A.: a.a.O., S. 2 ff 

108 1 ps entspricht 10'^ s. 
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6600. Ferner zeigten sich z.B. bei dem CDC-Rechner 7600 und dem IBM-Rechner 
360/91 erste Ansatze zum Pipelining 109 . Die Schaltzeiten erreichten Werte um 10 
ns 110 

Die Bedeutung des Parallelismus fiir die Performance-Steigerung innerhalb des 
Zeitraums von 1950 bis 1975 wird anhand der Gegenuberstellung von erreichter 
Performance und realisierten Schaltzeiten deutlich. Wahrend sich die Schaltzeiten 
nur etwa um den Faktor 10 3 verringert haben, ist die Performance um den Faktor 10 5 
gestiegen. 111 

In der vierten Generation (1975-heute) vollzieht sich nun der Ubergang vom seriel- 
len zum Parallelrechner 112 , da nach der Einfuhrung von large-scale integrierten 
(LSI) und very large-scale integrierten (VLSI) Schaltkreisen bedeutende Leistungs- 
steigerungen aufgrund der endlichen Signalgeschwindigkeit nicht mehr im Rahmen 
der verwendeten Halbleiter-Technologie moglich sind, sondern nur noch durch die 
Steigerung des Anteils an Parallelverarbeitung. 113 

3.3. Klassifikation von Rechnerarchitekturen 

In der Vergangenheit ist immer wieder der Versuch unternommen worden, die ver- 
schiedenen Rechnerarchitekturen zu klassifizieren. Die daraus entstandenen Klassi- 
fikationsschemata gehen z.T. von sehr unterschiedlichen Ansatzen aus. Um einen 
Eindruck von der Verschiedenheit der Ansatze zu vermitteln, werden im folgenden 
das FLYNN'sche Klassifikationsschema, das Schema von SHORE und die Klassifi- 
kation von HANDLER kurz vorgestellt. 



109 Das Prinzip des Pipelining wird im Abschnitt 3.4.1. 1. noch naher erlautert. 

110 1 ns entspricht 10' 9 s. 

111 Hockney, R.W., Jesshope, C.R.: Parallel computers 2, architecture, programming and algorithms, 
2. Aufl., Bristol Philadelphia 1988, S. 4 

112 TROTTENBERG nimmt fur die Parallelrechner ebenfalls eine Einteilung in Generationen vor. 
Hiernach bilden Vektorrechner die erste Generation von Parallelrechnem, Multi-Vektorrechner 
mit mehreren CPUs und dem Konzept eines gemeinsamen Speichers die zweite Generation und 
Multiprozessorsysteme mit vielen unabhangigen Prozessoren und eigenem lokalen Speicher die 
dritte Generation. Vgl. hierzu: Solchenbach, K., Thomas, B., Trottenberg, U.: Dem parallelen 
Rechnen gehort die Zukunft, in: Meuer, H.W. (Hrsg.), Supercomputer '89, Anwendungen, Ar- 
chitekturen, Trends, Mannheim, Juni 1989, Proceedings, Berlin Heidelberg 1989, S. 110-118, hier 
S. 110 

113 Hertweck, F.: Vektor- und Parallel-Rechner: Vergangenheit, Gegenwart, Zukunft, Informations- 
technik, 31. Jg., Heft 1, 1989, S. 5-22, hier S. 5 
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Am bekanntesten ist das FLYNN'sche Klassifikationsschema . n4 Aus der Kombina- 
tion der Aussagen 

eine Maschine bearbeitet zu einem gegebenen Zeitpurtkt genau einen Befehl 
(Single Instruction) 

eine Maschine bearbeitet zu einem gegebenen Zeitpunkt mehr als einen Befehl 
(Multiple Instruction) 

mit den Aussagen 

eine Maschine bearbeitet zu einem gegebenen Zeitpunkt genau einen Daten- 
wert (Single Data) 

eine Maschine bearbeitet zu einem gegebenen Zeitpunkt mehr als einen 
Datenwert (Multiple Data) 

bildet FLYNN vier Klassen von Rechnerarchitekturen: 

SISD: Single Instruction - Single Data 

SIMD: Single Instruction - Multiple Data 
MISD: Multiple Instruction - Single Data 
MIMD: Multiple Instruction - Multiple Data. 

SHORE dagegen schlagt ein Klassifikationsschema vor, das nicht auf dem Konzept 
des Instruktions- und Datenflusses beruht, sondern die Organisation der wesent- 
lichen Komponenten 115 eines Rechners als Ausgangspunkt der Klassifikation 
benutzt. Es werden sechs verschiedene Maschinen definiert, die bezuglich dieser 
Komponenten unterschiedlich organisiert sind. Jede Maschine stellt eine Klasse dar. 

Wahrend bei FLYNN und SHORE die Klassifikation eines Rechners dadurch reali- 
siert wird, daB eine Zuordnung zu einer der Klassen erfolgt, besitzt die Klassifikati- 
on von HANDLER eher beschreibenden Charakter. Nach HANDLER wird jeder 
Rechner klassifiziert, indem er anhand eines Tripels 

iRechnertyp = (k*k',d*d',w*w') mit den Elementen 

k Anzahl k von Steuerwerken 

k' Anzahl k' von spezialisierten Steuerwerken 



114 Giloi, W.K.: a.a.O., S. 25 

H5 SHORE zahlt hierzu die Kontrolleinheit (CU), die Prozessoreinheit (PU), den Instruktionsspei- 
cher (IM) und den Datenspeicher (DM). Vgl. hierzu: Hockney, R.W., Jesshope, C.R.: a.a.O., S. 58 
ff 
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d Anzahl d von Rechenwerken 

d' Anzahl d' von spezialisierten Rechenwerken 

w Verarbeitungswortbreite w der Rechenwerke 

w' Anzahl w' von spezialisierten elementaren Teilwerken, die iiberlappt Teilver- 
arbeitungsschritte auf den jeweiligen Bitpositionen ausfiihren, 

beschrieben wird. 116 

Da jedes Klassifikationsschema auf bestimmte Architekturklassen zugeschnitten ist, 
gibt es bisher noch kein allgemein anerkanntes Klassifikationsschema, in das sich 
alle Rechnerarchitekturen eindeutig und aussagekraftig einordnen lassen. 

3.4. Parallelrechnerarchitekturen 

Da die bisher entwickelten Parallelrechner sich insbesondere in der Art der Daten- 
und Instruktionsverarbeitung unterscheiden, wird fiir die Klassifikation der 
verschiedenen Parallelrechnerarchitekturen das FLYNN'sche Schema zugrunde 
gelegt. Hiernach lassen sich Parallelrechner in SIMD-Rechner und in MIMD-Rechner 
unterteilen. 

3.4.1. SIMD-Rechner 

Wahrend es bei einem SISD-Rechner nur moglich ist, zu einem gegebenen Zeitpunkt 
einen Befehl auf einen Datenwert anzuwenden, kann bei einem SIMD-Rechner ein 
Befehl gleichzeitig auf mehreren Datenwerten ausgefiihrt werden. 

Zu der Klasse der SIMD-Rechner zahlen die schon mehrfach angesprochenen 
Vektorrechner sowie Array-Rechner. 

3.4.1.1. Vektorrechner 

Vektorrechner besitzen eine spezielle, auf die Verarbeitung von Vektoren zuge- 
schnittene Architektur, die nach dem Fliefibandprinzip (Pipeline-Prinzip) arbeitet. 
Ahnlich wie bei der Fliefibandfertigung in der Industrie, wo die Fertigung eines 
Produktes in einzelne Teilschritte zerlegt wird, wird hierbei die Ausfuhrung eines 
Befehls im allgemeinen in die vier Schritte Befehl holen (BH), Befehl dekodieren 
(BD), Operand holen (OH) und Befehl ausfiihren (BA) zerlegt. Bei herkommlicher 
Verarbeitungsweise miissen zunachst alle Schritte eines Befehls ausgefiihrt worden 
sein, bis ein neuer Befehl bearbeitet werden kann. Fiir die Ausfiihrung eines Befehls 
werden damit, wie die Abbildung 4 zeigt, vier Zyklen benotigt. 



116 



Quinn, M.J.: Designing efficient algorithms for parallel computers, a.a.O., S. 17 
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Abbildung 4: Befehlsabarbeitung bei herkommlicher V erarbeitungsweise ( von Neumann- 

Rechner) 

Bei der Fliefibandverarbeitung dagegen werden hintereinanderfolgende Befehle 
iiberlappend ausgefiihrt. Wenn mit dem zweiten ScKritt des ersten Befehls begonnen 
wird, kann gleichzeitig mit dem ersten Schritt des zweiten Befehls begonnen wer- 
den; wenn mit dem dritten Schritt des ersten Befehls begonnen wird, kann gleich- 
zeitig mit dem zweiten Schritt des zweiten Befehls und mit dem ersten Schritt des 
dritten Befehls begonnen werden, usw.. Wenn die fur eine derartige Verarbeitungs- 
weise zur Verfugung stehende Pipeline gefullt ist, d.h. in jeder Stufe der Pipeline ein 
Befehlsschritt ausgefiihrt wird, erzeugt sie in jedem Zyklus ein Ergebnis. Die Lange 
des Zyklus richtet sich nach der langsamsten Stufe der Pipeline. 
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Abbildung 5: Befehlsabarbeitung nach dem Flieflbandprinzip 

Da bei einem Wechsel des Befehls z.B. von einer Addition zu einer Multiplikation 
die Pipeline umkonfiguriert werden mufi, erreicht sie ihre grofite Geschwindigkeit, 
wenn moglichst viele gleiche Befehle hintereinander verarbeitet werden miissen, wie 
dieses bei der Verarbeitung von Vektoren der Fall ist. 

Fur diese Form der Abarbeitung miissen Vektorrechner jedoch neben einem 
Skalarprozessor, der alle nicht vektoriell ausfiihrbaren Befehle, wie z.B. das Einlesen 
von Daten, ubernimmt, noch mindestens einen Vektorprozessor besitzen. Dieser ist 
dann mit den entsprechenden Vektor-Pipelines ausgestattet. Zur Bearbeitung wer- 
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den die Vektoren entweder aus speziellen Vektorregistern (register-to-register-Rech- 
ner) 117 oder aber direkt aus dem Speicher (memory-to-memory-Rechner) 118 geholt. 

3.4.I.2. Array-Rechner 

Ein Array- oder auch Feldrechner besteht aus mehreren identischen synchronisierten 
Prozessorelementen (PEs), die alle unter der Kontrolle einer einzigen Kontrolleinheit 
(CU) stehen und iiber ein Netzwerk miteinander verbunden sind. Jedes PE ist mit 
einer arithmetischen logischen Einheit und eigenen Registern ausgestattet. Es besitzt 
entweder eigenen lokalen Speicher, wie z.B. im Falle des Array-Rechners ILLIAC IV, 
oder alle PEs teilen sich parallele Speichermodule, auf die jedes PE iiber ein entspre- 
chendes Netzwerk zugreifen kann, wie z.B. beim Burroughs Scientific Processor 
(BSP). Die Kontrolleinheit besitzt eigenen Speicher zum Flalten von Programmen. 
Die Daten werden vor der parallelen Verarbeitung auf die einzelnen lokalen Spei- 
cher oder die parallelen Speichermodule aufgeteilt. Skalar- oder Kontrollbefehle 
werden direkt von der Kontrolleinheit bearbeitet. Vektorbefehle werden von der 
Kontrolleinheit dekodiert und anschliefiend iiber das Netzwerk als sogenannte 
Broadcast an die benotigte Anzahl PEs geschickt. Diese fiihren dann synchron die 
gleiche Operation auf verschiedenen Operanden aus. 119 Die Anzahl der PEs ist bei 
den einzelnen Array-Rechnern sehr unterschiedlich. Eine Ubersicht findet sich in 
Tabelle 4. 



Array-Rechner 


Anzahl der PEs 


BSP 


4x4 


16 


ILLIAC IV 


8x8 


64 


ICL DAP 


64 x 64 


4096 


MPP 


128 x 128 


16384 



Tabelle 4: Anzahl PEs unterschiedlicher Array-Rechner 



Wahrend bei einem Vektorrechner eine Matrix nur durch die Zerlegung in einzelne 
Vektoren bearbeitet werden kann, auf denen dann die gewiinschte Operation vekto- 



^ 7 Schonauer, W.: Scientific Computing on Vector Computers, Amsterdam New York 1987, S. 12 
und S. 159 

118 Schonauer, W.: a.a.O., S. 18, S. 33 und S. 159 

119 Hwang, K., Briggs, F.A.: a.a.O., S. 325-327 
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riell ausgefuhrt wird, ist ein Array-Rechner in der Lage, eine gesamte Matrix bzw. 
Teilmatrix gleichzeitig zu bearbeiten. 

3.4.2. MIMD-Rechner 

In die Klasse der MIMD-Rechner fallen die Multiprozessorsysteme. Sie bestehen aus 
mehreren einzelnen Prozessoren, die im Gegensatz zu den PEs bei den Array-Rech- 
nern unabhangig voneinander programmiert werden konnen. 

Es existieren eine Vielzahl von unterschiedlichen Systemen. Da fur die weitere Be- 
trachtung insbesondere der Grad der Parallelitat und der Grad der Kopplung in- 
teressant sind, wird genauer auf gering und massiv parallele Systeme sowie 
schwach und stark gekoppelte Systeme eingegangen. 120 

3.4.2.I. Schwach und stark gekoppelte Multiprozessorsysteme 

Bei einem schwach gekoppelten Multiprozessorsystem besitzen die einzelnen Pro- 
zessoren einen ausreichend grofien lokalen Speicher. Die Kommunikation zwischen 
den Prozessoren erfolgt durch den Austausch von Nachrichten fiber eine gemein- 
same Kommunikationseinrichtung, ein sogenanntes Message-Transfer-System. Hier- 
bei handelt es sich entweder um einen gemeinsamen Bus oder einen gemeinsamen 
Speicher, der den Prozessoren ausschliefilich fiir die Kommunikation zur Verfiigung 
steht. Das bekannteste Beispiel fiir ein schwach gekoppeltes Multiprozessorsystem 
ist der von der Carnegie Mellon Universitat entwickelte Cm*. 121 Altere kommer- 
zielle Systeme sind z.B. der BBN Butterfly, der Intel iPSC oder der NCUBE. 122 
Neuere Systeme sind z.B. Intels Paragon™ XP/S, der Parsytec GC, der CM-5 von 
Thinking Machine oder der VPP500 von Siemens Nixdorf. 

Stark gekoppelte Multiprozessorsysteme sind durch einen gemeinsamen Speicher 
charakterisiert, der nicht, wie bei schwach gekoppelten Systemen, ausschliefilich fiir 
die Kommunikation zur Verfiigung steht, sondern auf dem samtliche Daten gespei- 
chert sind. Jeder Prozessor kann iiber einen zentralen Schaltmechanismus den globa- 
len gemeinsamen Speicher erreichen. 123 Als Beispiel fiir das erste kommerziell ver- 
fiigbare stark gekoppelte Multiprozessorsystem ist der Denelcor HEP (Heterogenous 



120 Weitere Unterscheidungsmerkmale sind z.B. homogen - inhomogen, symmetrisch - asymme- 
trisch; vgl. hierzu Giloi, W.: a.a.O., S. 308 f 

121 Eine Beschreibung des Rechners findet sich z.B. in: Quinn, M.J.: Designing efficient algorithms 
for parallel computers, a.a.O., S. 37-41; Hwang, K., Briggs, F.A.: a.a.O., S. 460-468 

1 22 Diese drei kommerziellen Multiprozessorsysteme sind z.B. beschrieben in: Hockney, R.W., 
Jesshope, C.R.: a.a.O., S. 42 und S. 47 f 

123 Quinn, M.J.: Designing efficient algorithms for parallel computers, a.a.O., S. 35-37; Hwang, K., 
Briggs, F.A.: a.a.O., S. 468-471 und S. 481-492 
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Element Processor) zu nennen. Als weitere kommerzielle Systeme dieser Klasse sind 
der Encore Multimax und der Sequent Balance zu erwahnen. 124 Gegenwartig weisen 
i.a. nur noch Vektorrechner mit mehreren Prozessoren, wie z.B. die CRAY X-MP 
oder die CRAY Y-MP, eine starke Kopplung auf. 

3.4.2.2. Gering und massiv parallele Multiprozessorsysteme 

Der Grad der Parallelitat wird durch die Anzahl der Prozessoren bestimmt, die ein 
Multiprozessorsystem besitzt. Da jedoch mit der fortschreitenden Entwicklung die 
Anzahl der Prozessoren der verschiedenen Multiprozessorsysteme immer weiter 
ansteigt, ist eine starre Definition nicht zweckmafiig. 

Wahrend anfanglich Systeme mit typischerweise 2 bis 8 Prozessoren, wie z.B. der 
CRAY X-MP- oder der ETA-1 0-Rechner, als gering und Systeme mit mehr als 10 
Prozessoren zumeist schon als massiv parallel bezeichnet wurden, erscheint heutzu- 
tage durch die Einfuhrung der CRAY Y-MP C90 mit 16 Prozessoren und aufgrund 
der Tatsache, dafi fur etwa 1995 ein 32-Prozessor Vektorrechner erwartet wird und 
auch ein 64-Prozessor- Vektorrechner als beherrschbar gilt 125 , eher eine Einteilung 
mit weniger als 64 fur gering und mehr als 64 fur massiv parallele Systeme zeitge- 
mafi. Ferner ist zu beachten, dafi durch die Moglichkeit der Skalierbarkeit, die mo- 
derne massiv parallele Systeme bieten, nicht immer eindeutig eine Zuweisung mog- 
lich ist, da hiemach die kleineren Ausbaustufen von der Anzahl der Prozessoren her 
gesehen noch als gering paralleles System gelten konnen. 

Gering parallele Systeme sind demnach im wesentlichen die zuvor schon angespro- 
chenen Vektorrechner. Sie verfiigen zumeist iiber einen gemeinsamen Speicher, sind 
also stark gekoppelt. 126 

Bei den massiv parallelen Systemen sind die einzelnen Prozessoren nicht so schnell 
wie die Prozessoren eines gering parallelen Systems, dafiir aber wesentlich kosten- 
giinstiger. Da bei einer sehr grofien Anzahl von Prozessoren Konflikte beim Zugriff 
auf einen gemeinsamen Speicher entstehen, sind massiv parallele Systeme mit einer 
sehr grofien Anzahl von Prozessoren in der Regel schwach gekoppelte Systeme, wie 
z.B. der Hochleistungsrechner SUPRENUM 127 oder alle oben schon angesprochenen 
schwach gekoppelten Multiprozessorsysteme. 



124 Diese stark gekoppelten Systeme sind wiederum beschrieben in: Hockney, R.W., Jesshope, C.R.: 
a.a.O., S. 43-46 

125 Mierzowski, K.: Vektorrechner liegen noch vom im Supercomputer-Markt, VDI nachrichten, Nr. 
33, 14. August 1992, S. 10 

12 ^ Solchenbach, K., Thomas, B., Trottenberg, U.: a.a.O., S. 114 
127 Solchenbach, K., Thomas, B., Trottenberg, U.: a.a.O., S. Ill 
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Die Tabelle 5 gibt einen Uberblick iiber bekannte Multiprozessorsysteme, deren Pro- 
zessorzahl und den damit verbundenen Grad der Parallelitat sowie die Art der 
Kopplung. 



Multiprozessor- 

system 


Anzahl 

Prozessoren 128 


Art der Kopplung 


Grad der 
Parallelitat 129 


CRAY X-MP 


4 


stark 


gering 


CRAY Y-MP C90 


16 


stark 


gering 


ETA-10 


8 


stark 


gering 


Denelcor HEP 


16 


stark 


massiv 


Encore Multimax 


20 


stark 


massiv 


Sequent Balance 


12 bzw. 24 


stark 


massiv 


Cm* 


50 


schwach 


massiv 


BBN Butterfly 


bis 256 


schwach 


massiv 


Intel iPSC 


32,64,128 


schwach 


massiv 


NCUBE/10 


1024 


schwach 


massiv 


SUPRENUM 


bis 256 


schwach 


massiv 


Paragon™ XP/S 


66-4000 


schwach 


massiv 


Parsytec GC 


64-16384 


schwach 


massiv 


VPP500 


7-222 


schwach 


gering - massiv 



Tabelle 5: Art der Kopplung und Grad der Parallelitat bekannter Multiprozessorsysteme 

3.5. Neuere Architekturen 

Die bisher betrachteten Parallelrechnerarchitekturen sind alle kontrollgesteuert. Das 
auszufiihrende Programm hat die gesamte Kontrolle iiber die Abarbeitungsreihen- 
folge der einzelnen Programmbefehle. Ein zentraler Kontrollmechanismus gewahr- 



12 ** Die Angaben zur Anzahl Prozessoren sind beim Paragon™ XP/S, dem Parsytec GC und dem 
VPP500 Herstellerangaben entnommen. 

129 Di e Angaben zum Grad der Parallelitat basieren jeweils auf der zum Zeitpunkt der Entwicklung 
bestehenden Auffassung. 
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leistet eine synchrone Bearbeitung, die allerdings der Parallelitat relativ schnell 
Grenzen setzt. Aus diesem Grund wurde versucht, mit Hilfe von neuartigen Archi- 
tekturen ein noch hoheres Mafi an Parallelitat zu erzielen. Ein Ansatz hierzu ist die 
Entwicklung des Datenflufirechners. 

Bei einem Datenflufirechner erfolgt die Bearbeitung datengesteuert. Ein Befehl wird 
sofort ausgefiihrt, wenn die entsprechenden Operanden verfiigbar sind. Dadurch 
konnen viele Befehle gleichzeitig und asynchron verarbeitet werden . 130 

Die Entwicklung von Datenflufirechnern ist noch in der Anfangsphase. Aussagen 
iiber den Erfolg derartiger Rechner lassen sich deshalb noch nicht machen . 131 

3.6. Vemetzte Systeme 

Parallelverarbeitung ist jedoch nicht nur auf speziell hierfiir entwickelten Parallel- 
rechnern moglich, sondern kann auch auf vernetzten Systemen, wie PC- und Work- 
station-LANs, durchgefiihrt werden . 132 

PCs und Workstations kommen in Unternehmen typischerweise als Arbeitsplatz- 
rechner zum Einsatz. Wahrend die einzelnen Rechner friiher in der Regel nicht mit- 
einander vernetzt waren, zeigt sich heutzutage ein immer grofierer Trend zur Ver- 
netzung. Da die Rechner zumeist nur zu einem sehr geringen Teil ausgelastet sind, 
besteht ein grofies Potential an ungenutzter Prozessorzeit . 133 Es bietet sich daher an, 
rechenintensive Aufgaben auf die verschiedenen Rechner in einem vernetzten 
System zu verteilen, um so unter einer effizienten Ausnutzung der vorhandenen 
Ressourcen zu einer moglichst schnellen Bewaltigung der anstehenden recheninten- 
siven Aufgaben zu gelangen. 

3.7. Leistungsbetrachtung von Parallelrechnem 

Parallelrechner sollen Probleme schneller losen als herkommliche Rechner. Dies ist 
jedoch nur moglich, wenn ein Hochstmafi an Parallelverarbeitung durch die auf 
einem Parallelrechner eingesetzten parallelen Algorithmen erzielt werden kann. Zur 



130 £)j e Architektur von Datenflufirechnem wird z.B. erklart in: Quinn, M.J.: Designing efficient 
algorithms for parallel computers, a.a.O., S. 11 f; Hwang, K., Briggs, F.A.: a.a.O., S. 732 ff 

131 Hwang, K., Briggs, F.A.: a.a.O., S. 747 

132 Im Zusammenhang mit der parallelen Verarbeitung auf einem Works tation-L AN wird auch von 
einem Workstation-Cluster gesprochen. 

133 ohne Autor: Kostendruck verandert die vorhandene DV-Landschaft, PC magazin, Nr. 34, 19. 
August 1992, S. 41-43 
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Beurteilung derartiger paralleler Algorithmen werden iiblicherweise die beiden 
GroBen "Speedup" und "Effizien z" herangezogen . 134 

Der Speedup ist das Verhaltnis zwischen der Bearbeitungszeit, die der schnellste 
sequentielle Algorithmus auf dem betrachteten Parallelrechner benotigt, und der 
Bearbeitungszeit, die der Parallelrechner zur Ausfiihrung des parallelen Algorith- 
mus unter Verwendung von N Prozessoren benotigt . 135 

Sei T(l) die Zeit fur die Bearbeitung des schnellsten sequentiellen Algorithmus auf 
dem betrachteten Parallelrechner und T(N) die Zeit fur die Bearbeitung des paralle- 
len Algorithmus unter Verwendung von N Prozessoren. Der Speedup S ist dann wie 
folgt definiert: 



S(N) = 



T(l) 

T(N) 



(3.1) 



In der Literatur existieren noch weitere Definitionen fiir den Speedup. So wird z.B. 
von einigen Autoren nicht die Bearbeitungszeit des schnellsten sequentiellen Algo- 
rithmus als Basis fiir die Speedup-Berechnung herangezogen, sondern die Bearbei- 
tungszeit, die fiir die Ausfiihrung des parallelen Algorithmus auf nur einem Prozes- 
sor benotigt wird. Da der parallele Algorithmus oftmals noch zusatzliche Operatio- 
nen enthalt, die fiir die parallele, jedoch nicht fiir die sequentielle Verarbeitung 
benotigt werden, wird die Bearbeitungszeit fiir die sequentielle Verarbeitung hierbei 
als zu hoch angesetzt und damit auch der Speedup zu positiv bewertet . 136 

Die Effizienz E stellt ein MaB fiir die Auslastung der Prozessoren dar. Es gilt hierfiir: 



E(N) = 



S(N) 

N 



(3.2) 



Im Zusammenhang mit der Parallelverarbeitung wird immer wieder die Frage nach 
der Hohe des tatsachlich erreichbaren Speedups aufgeworfen. Eine Antwort hierauf 
versucht AMDAHL'S Gesetz zu geben. Es besagt, daB der sequentielle Anted an 
einem Programm die Gesamtrechenzeit wesentlich beeinfluBt. 



134 Plewka, W., Reischuk, R.: Grundlagen parallelen Rechnens, HMD Theorie und Praxis der Wirt- 
schaftsinformatik, Parallelverarbeitung, 27. Jg., Heft 155, September 1990, S. 3-19, hier S. 14 f 

135 Quinn, M.J.: Designing efficient algorithms for parallel computers, a.a.O., S. 43 

13 6 Quinn, M.J.: Designing efficient algorithms for parallel computers, a.a.O., S. 44 
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Sei f (0 < f < l) der Anteil sequentiell auszufuhrender Operationen in einem Pro- 
gramm, das auf N Prozessoren ausgefiihrt werden soil. Fur den maximal erreichba- 
ren Speedup gilt dann: 137 

S(N) < (3.3) 

f + — 

N 

1st also fur ein Programm der Anteil sequentiell auszufuhrender Operationen be- 
kannt, lafit sich mit Hilfe von AMDAHL'S Gesetz theoretisch bestimmen, ob ein 
Programm sich zur Parallelisierung eignet oder nicht. 




Diagramm 1 a,b: Maximal erreichbarer Speedup nach AMDAHL'S Gesetz und 

GUSTAVSON 

Wie das Diagramm la zeigt, reduziert schon ein geringer Anteil von Operationen, 
die nur sequentiell ausgefiihrt werden konnen, den Speedup erheblich, so dafi Paral- 
lelverarbeitung nach AMDAHL nur bedingt sinnvoll erscheint. 

Eine deutlich optimistischere Schatzung liefert, wie ein Vergleich der Diagramme 1 a 
und b zeigt, GUSTAVSON 138 . Er kritisiert an AMDAHL'S Gesetz, dafi von einem 
fixen Anteil sequentiell zu berechnender Operationen f und einer variierenden 
Anzahl von Prozessoren ausgegangen wird. In der Praxis dagegen verandert sich in 
erster Linie die Problemgrofie, nicht aber die Anzahl der Prozessoren. Deswegen ist 



137 Quinn, M.J.: Designing efficient algorithms for parallel computers, a.a.O., S. 19 

138 Gustavson, J.L.: Reevaluating Amdahl's law. Communications of the ACM, Vol. 31, Nr. 5, 1988, 
S. 532-533 
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es seiner Meinung nach realitatsnaher, von einer konstanten Bearbeitungszeit und 
nicht von einer konstanten Problemgrofie auszugehen. Diese Uberlegung fiihrte 
GUSTAVSON dazu, nicht die sequentielle Bearbeitungszeit konstant zu setzen und 
daraus die parallele Bearbeitungszeit abzuleiten, sondern umgekehrt die parallele 
Bearbeitungszeit konstant zu setzen und daraus die sequentielle Bearbeitungszeit 
abzuleiten. Hierdurch wird eine wesentlich optimistischere Schatzung fur den 
Speedup erreicht, die im Gegensatz zu AMDAHL'S Gesetz auch massiv parallele 
Verarbeitung sinnvoll erscheinen lafit. 

S(N) < f + (l-f) N (3.4) 

Sowohl AMDAHL als auch GUSTAVSON schatzen den Speedup auf der Grundlage 
eines gegebenen Algorithmus ab. Im Hinblick auf die Beurteilung eines Parallel- 
rechners interessiert jedoch vielmehr, welcher Speedup allgemein, also unabhangig 
von einem bestimmten Algorithmus, erzielt werden kann. 

Hierzu existieren verschiedene Ansatze, die jedoch lediglich auf Erfahrungswerten 
beruhen und somit nicht als allgemeingiiltig angesehen werden konnen. 

Nach MINSKY's Vermutung steigt der Speedup nicht proportional mit der Anzahl 
eingesetzter Prozessoren an, sondern nur mit dem Logarithmus dieser Anzahl: 139 

S(N) = log 2 N (3.5) 

Wie aus dem Diagramm 2 hervorgeht, fiihrt MINSKY's Vermutung, ebenso wie 
AMDAHL'S Gesetz, zu einer sehr pessimistischen Schatzung des erreichbaren 
Speedups, die den Einsatz von massiv parallelen Systemen nicht sinnvoll erscheinen 
lafit. 

Eine andere Abschatzung wurde von LEE vorgenommen. Hiernach gilt fur den 
Speedup: 140 

S(N)<-^- (3.6) 

In N 

Wahrend MINSKY's Vermutung als untere Grenze fur den Speedup gewertet wer- 
den kann, ist LEE's Abschatzung als eine realistische obere Grenze anzusehen. 141 T42 



139 Quinn, M.J.: Designing efficient algorithms for parallel computers, a.a.O., S. 18; Hwang, K., 
Briggs, F.A.: a.a.O., S. 27-29; Giloi, W.K.: a.a.O., S. 141 

140 Hwang, K., Briggs, F.A.: a.a.O., S. 27-29 

141 Giloi, W.K.: a.a.O., S. 142 
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Diagramm 2: Maximal zu erreichender Speedup nach MINSKY's Vermutung und nach 

LEE 

Der geringe zu erwartende Speedup ist auf das Vorhandensein von sogenannten 
Overheads zuriickzufiihren, die den Zeitaufwand der parallelen Verarbeitung nega- 
tiv beeinflussen . 143 In diesem Zusammenhang taucht deshalb in der Literatur immer 
wieder die Frage auf, ob ein super linearer Speedup iiberhaupt moglich ist . 144 Hier- 
bei bedeutet superlinear, dafi der Speedup bei N eingesetzten Prozessoren grower als 
N ist, oder anders ausgedriickt, dafi die Bearbeitungszeit mit nur einem Prozessor 
mehr als N mal grower ist als mit N Prozessoren. 

FABER, LUBECK und WHITE 145 vertreten die Meinung, dafi die Bearbeitungszeit 
eines sequentiellen Algorithmus hochstens das N-fache der Bearbeitungszeit eines 
parallelen Algorithmus bei Verwendung von N Prozessoren betragen kann, da sich 
jeder sequentielle Algorithmus als Simulation des betrachteten parallelen Algorith- 
mus darstellen lafit, indem die im Falle des parallelen Algorithmus parallel ablau- 



14 ^ Mit der Performance von Parallelrechnem befassen sich ebenfalls FLATT und KENNEDY; vgl. 
hierzu: Flatt, H.P., Kennedy, K.: Performance of parallel processors. Parallel Computing, Vol. 12, 
1989, S. 1-20 

143 Die verschiedenen Overheads werden im nachsten Abschnitt naher beschrieben. 

144 Die im folgenden zitierten Literaturquellen stellen nur einen Ausschnitt eines Literaturiiber- 
blicks von SCHAUER dar. Vgl. hierzu: Schauer, A.: Superlinearer Speedup mit parallelen Pro- 
grammen, Bericht Nr. 9005, Universitat der Bundeswehr Miinchen, Fakultat fiir Informatik, Juni 
1990 

145 Faber,V., Lubeck, O.M., White Jr., A.B.: Superlinear speedup of an efficient sequential algorithm 
is not possible. Parallel Computing, Vol. 3, 1986, S. 259-260 
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fenden Schritte beim sequentiellen Algorithmic jeweils sequentiell ausgefiihrt wer- 
den. Diese Beweisfuhrung macht deutlich, dafi die Autoren einerseits nicht von 
einem superlinearen Speedup sprechen, wenn Hardwarebeschrankungen, wie z.B. 
Speicherbeschrankungen, dazu fiihren, dafi der sequentielle Algorithmus mehr als N 
mal langsamer ist als der parallele Algorithmus, andererseits aber erlauben, dafi z.B. 
bei Baumsucheverfahren 146 nicht von einer konsistenten Suchstrategie fiir den se- 
quentiellen und den parallelen Fall ausgegangen wird. 

Andere Autoren dagegen berichten von praktischen Fallen, in denen ihrer Erfahrung 
nach ein superlinearer Speedup aufgetreten ist. Hierbei wurde ein superlinearer 
Speedup entweder aus algorithmischen Griinden, wie z.B. aufgrund von Beschleu- 
nigungsanomalien 147 , oder aufgrund von Hardware- oder Softwarebeschrankun- 
gen 148 erzielt. 

Neben diesen praktischen Fallen, in denen nach Meinung der jeweiligen Autoren ein 
superlinearer Speedup aufgetreten ist, wurde auch theoretisch versucht, die Existenz 
eines superlinearen Speedups nachzuweisen. So leiten z.B. HELMBOLD und 
McDOWELL 149 anhand von verschiedenen Wahrscheinlichkeitsmodellen allgemein 
die Moglichkeit eines superlinearen Speedups her, wahrend andere Autoren spezi- 
elle parallele Branch-and-Bound-Algorithmen betrachten und zu dem Schlufi kom- 
men, dafi unter bestimmten Bedingungen ein superlinearer Speedup moglich ist . 150 

3.8. Leistungsmindernde Faktoren der Parallel verarbeitung 

Wie im vorangehenden Abschnitt schon erwahnt worden ist, existieren verschiedene 
leistungsmindernde Faktoren, die sogenannten Overheads, die in der Regel verhin- 
dern, dafi durch Parallelverarbeitung ein linearer Geschwindigkeitszuwachs erzielt 
wird. Es handelt sich hierbei um den algorithmischen Overhead, den Kommunikati- 



14 ^ Hierzu zahlt auch der in der vorliegenden Arbeit betrachtete Branch-and-Bound- Algorithmus. 

147 Vgl. z.B.: Speckenmeyer, E v Monien, B., Vomberger, O.: Superlinear Speedup for Parallel Back- 
tracking, in: Houstis, E.N., Papatheodorou, T.S., Polychronopoulos, C.D. (Hrsg.), Supercompu- 
ting 1st International Conference, Athens, Greece, Juni 1987, Proceedings, Berlin Heidelberg 
1988, S. 985-993 

148 Vgl. hierzu: Li, K.: IVY: A Shared Virtual Memory System for Parallel Computing, in: Sturgis, 
H.E. (Hrsg.), Proceedings of the 1988 International Conference on Parallel Processing, Vol. II, 
Software, August 1988, Pennsylvania State University 1988, S. 94-101; Sanguinetti, J.: Perfor- 
mance of a Message-based Multiprocessor, Computer, Vol. 19, Nr. 9, September 1986, S. 47-55 

149 Helmbold, D.P., McDowell, C.E.: Modeling Speedup(n) greater than n, in: Ris, F., Kogge, P.M. 
(Hrsg.), Proceedings of the 1989 International Conference on Parallel Processing, Vol. Ill, Algo- 
rithms and Applications, August 1989, Pennsylvania State University 1989, S. 219-225 

^0 Auf das Auftreten von super linearem Speedup bei einem parallelen Branch-and-Bound -Algo- 
rithmus wird noch im Kapitel 5 eingegangen. 
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ons-, den Scheduling-, den Synchronisations- sowie den Software-Overhead. Sie 
werden im folgenden kurz vorgestellt. 

Algorithmischer Overhead: 

Wenn es zur Losung eines Problems auf dem verwendeten Parallelrechner keinen 
parallelen Algorithmus gibt, der genauso leistungsstark ist wie der beste sequentielle 
Algorithmus, entsteht ein algorithmischer Overhead . 151 Dieses ist insbesondere 
iiberall dort der Fall, wo der sequentielle Algorithmus stark rekursiv ist. Beispiele 
fur das Auftreten von algorithmischem Overhead sind Sortieralgorithmen oder 
Baumsucheverfahren. Bei letzteren miissen u.U. bei der parallelen Verarbeitung 
mehr Knoten eines Baumes untersucht werden als bei der sequentiellen Verarbei- 
tung . 152 

Kommunikationsoverhead: 

Der Austausch von Daten zwischen den einzelnen Prozessoren erfolgt typischerwei- 
se entweder fiber das Schreiben in und Lesen aus einem global verfiigbaren Speicher 
oder fiber das Senden und Empfangen der entsprechenden Daten in einer Nach- 
richt . 153 Die hierfiir benotigte Zeit wird als Kommunikationsoverhead bezeichnet. 

S che d ul in g- Overhead: 

Wird die Arbeit nicht gleichmafiig auf die an der Bearbeitung vorhandenen Prozes- 
soren verteilt, entstehen fur einige Prozessoren Wartezeiten, die auch als Scheduling- 
Overhead bezeichnet werden. Die Gesamtbearbeitungszeit richtet sich dann nach 
dem langsamsten Prozessor, so dafi ein linearer Speedup nicht mehr moglich ist . 154 



151 Fox, G.C., Johnson, M.A., Lyzenga, G.A., Otto, S.W., Salmon, J.K., Walker, D.W.: Solving Pro- 
blems On Concurrent Processors, Vol. I, General Techniques and Regular Problems, Englewood 
Cliffs New Jersey 1988, S. 55 

152 Der dadurch auftretende algorithmische Overhead wird auch als Such-Overhead bezeichnet. 
Vgl. hierzu: Altmann, E., Marsland, T.A., Breitkreutz, T.: Accounting for Parallel Tree Search 
Overheads, in: Baily, D.H. (Hrsg.), Proceedings of the 1988 International Conference on Parallel 
Processing, August 1988, Vol. Ill, Algorithms and Applications, August 1988, Pennsylvania State 
University 1988, S. 198-201, hier S. 198 

153 Fox, G.C., Johnson, M.A., Lyzenga, G.A., Otto, S.W., Salmon, J.K., Walker, D.W.: a.a.O., S. 56; 
Altmann, E., Marsland, T.A., Breitkreutz, T.: a.a.O., S. 198; Hockney, R.W., Jesshope, C.R.: 
a.a.O., S. 102 

154 Fox, G.C., Johnson, M.A., Lyzenga, G.A., Otto, S.W., Salmon, J.K., Walker, D.W.: a.a.O., S. 56; 
Hockney, R.W., Jesshope, C.R.: a.a.O., S. 102 
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SynchrQnig^tiQngQvgrhg^ci: 

Um eine richtige Bearbeitungsreihenfolge des parallelen Algorithmus zu gewahrlei- 
sten, mufi eine Synchronisation der einzelnen Prozessoren erfolgen. Einige Prozesso- 
ren mussen dadurch eventuell auf Ergebnisse von anderen Prozessoren warten, so 
dafi ein Synchronisationsoverhead entsteht . 155 Ferner tritt auch dann ein Synchroni- 
sationsoverhead auf, wenn ein Prozessor auf eine Ressource zugreifen will, die 
schon von einem anderen Prozessor belegt ist . 156 Hier mufi dann der Prozessor so- 
lange warten, bis die Ressource wieder freigegeben ist. 

Software-Overhead: 

Selbst bei identischer sequentieller und paralleler Implementation des Anwender- 
programms ist es moglich, dafi bei der parallelen Verarbeitung zusatzliche Opera- 
tionen ausgefiihrt werden mussen. Dieser Software-Overhead entsteht z.B., wenn 
zusatzliche Indexoperationen aufgrund verteilter Datenhaltung notwendig wer- 
den . 157 Er wird im folgenden als vernachlassigbar gering angesehen. 



155 p OX/ g.c., Johnson, M.A., Lyzenga, G.A., Otto, S.W., Salmon, J.K., Walker, D.W.: a.a.O., S. 56; 
Altmann, E., Marsland, T.A., Breitkreutz, T.: a.a.O., S. 198; Hockney, R.W., Jesshope, C.R.: 
a.a.O., S. 102 

15 6 Sanguinetti, J.: Performance of a Message-based Multiprocessor, Computer, Vol. 19, Nr. 9, Sep- 
tember 1986, S. 47-55, hier S. 47 

157 Fox, G.C., Johnson, M.A., Lyzenga, G.A., Otto, S.W., Salmon, J.K., Walker, D.W.: a.a.O., S. 56 




4. Branch-and-Bound-Algorithmen zur Losung gemischt- 
ganzzahliger Optimierungsprobleme 

Zur Losung von linear en kontinuierlichen Optimierungsproblemen wurde 1947 von 
DANTZIG das Simplexverfahren entwickelt. 158 Da hiermit jedoch nur kleine Pro- 
bleme bewaltigt werden konnten, sind eine Vielzahl algorithmischer Verbesserun- 
gen vorgenommen worden, so dafi heute kommerzielle Software-Pakete zur linearen 
Optimierung in der Lage sind, Probleme mit mehreren tausend Restriktionen und 
Variablen zu losen. 

Wird ein ganzzahliges oder gemischt-ganzzahliges Problem mit Hilfe des Simplex- 
verfahrens ohne Beriicksichtigung der Ganzzahligkeitsbedingung gelost, so sind in 
aller Regel die Ganzzahligkeitsbedingungen nicht erfiillt. Ein einfaches Auf- oder 
Abrunden der als ganzzahlig geforderten Variablen fiihrt nicht zwangslaufig 159 zu 
einer zulassigen oder optimalen ganzzahligen bzw. gemischt-ganzzahligen Losung, 
so dafi fiir derartige Problemstellungen neue Verfahren entwickelt werden mufiten. 

Der erste Ansatz, das sogenannte Schnittebenenverfahren, geht auf GOMORY 
zuriick. 160 Hierbei wird zunachst das Optimierungsproblem ohne Beriicksichtigung 
der Ganzzahligkeitsbedingungen gelost. Anschliefiend werden fiir die nichterfiillten 
ganzzahligen Variablen sukzessiv lineare Nebenbedingungen (Schnittebenen) hin- 
zugefiigt, die mehr und mehr nichtganzzahlige Losungen eliminieren, jedoch mogli- 
che ganzzahlige Losungen nicht ausschlielSen. 161 

Das Schnittebenenverfahren konnte sich in der Praxis nicht durchsetzen, da seine 
Leistungsfahigkeit sehr stark von der Problemstruktur abhangig ist. Deshalb wird 
heutzutage in den meisten Software-Paketen zur ganzzahligen bzw. gemischt-ganz- 
zahligen Optimierung das sogenannte Branch-and-Bound- Verfahren einge- 

setzt.162,163 



Dantzig, G.B.: Linear Programming and Extensions, Princeton 1963 

Es gibt nur eine geringe Anzahl von Problemen, wie z.B. das Transport- oder das Zuordnungs- 
problem, bei denen grundsatzlich gewahrleistet ist, dafi das Simplexverfahren eine ganzzahlige 
Losung liefert. Vgl. hierzu z.B.: Hillier, F.S., Liebermann, G.J.: Introduction to Operations 
Research, 4. Aufl., Oakland 1986, S. 401 

160 Geoffrion, A.M., Marsten, R.E.: Integer Programming Algorithms: A Framework and State-of- 
the-Art Survey, Management Science, Vol. 18, Nr. 9, 1972, S. 465-491, hier S. 483 

161 Eine detailliertere Beschreibung findet sich z.B. in: Burkard, R.E.: Methoden der Ganzzahligen 
Optimierung, Wien New York 1972, S. 131 ff 

162 Hillier, F.S., Liebermann, G.J.: a.a.O., S. 420 
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4.1. Darstellung der allgemeinen Prinzipien eines Branch-and-Bound- 
Algorithmus 

Beim Branch-and-Bound-Verfahren handelt es sich um eine geschickte, systemati- 
sche Suche nach der optimalen Losung eines Problems innerhalb der Menge aller 
zulassigen Losungen dieses Problems, die auf zwei Prinzipien beruht, dem Prinzip 
des Branching und dem Prinzip des Bounding. 164 

Das Prinzip des Branching besteht darin, das zu losende Optimierungsproblem P 0 
derart in eine Anzahl von Teilprobleme P!,...,P k zu zerlegen, dafi fiir die Losungs- 
mengen L(P 0 ), L(P 1 ),...,L(P k ) gilt: 

k 

L(P 0 ) = (jL(Pi) (4.1) 

i=l 

Um den Rechenaufwand gering zu halten, sollten die Losungsmengen L(P 1 ),...,L(P k ) 
disjunkt sein. 

L(Pj ) o L(Pj ) = 0 Vi, j=l,...,k, i * j (4.2) 

An jedem Teilproblem \x kann nun wiederum weiter verzweigt werden, so dafi gilt: 
k 

L(P^)=|J L (Pm) V (4.3) 

i=l 

Der Verzweigungsprozefi wird solange fortgesetzt, bis jedes noch nicht verzweigte 
Teilproblem hochstens eine zulassige Losung besitzt. 

Der Verzweigungsprozefi lafit sich anhand eines Verzweigungsbaums 165 B = (V,E) 
mit V als Knotenmenge und E als Kantenmenge darstellen. Die Knotenmenge be- 
steht dabei aus zwei disjunkten Mengen, und zwar einer Menge Vg von Blattknoten 
und einer Menge V N von Nicht-Blattknoten. Die Blattknoten sind diejenigen Knoten, 
die keinen Nachfolger besitzen, und die Nicht-Blattknoten sind diejenigen Knoten, 
die einen Nachfolger besitzen. Im folgenden wird der Verzweigungsbaum auch als 



163 Neben der Anwendung im Bereich des Operations Research kommen Branch-and-Bound-Ver- 
fahren aber auch im Bereich der Kiinstlichen Intelligenz zum Einsatz. Vgl. hierzu z.B.: Nilsson, 
N.J.: Problem-solving Methods in Artificial Intelligence, New York 1971, S. 10 f 

164 Lawler, E.L., Wood, D.E.: Branch-and-Bound Methods: A Survey, Operations Research, Vol. 14, 
Nr. 4, 1966, S. 699-719; Mitten, L.G.: Branch-and-Bound Methods: General Formulation and 
Properties, Operations Research, Vol. 18, Nr. 1, 1970, S. 24-34 

165 In der Literatur finden sich auch die Begriffe Losungsbaum oder Entscheidungsbaum. Vgl. 
hierzu: Domschke, W.: Logistik: Rundreisen und Touren, Miinchen Wien 1982, S. 7 
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Branch-and-Bound-Baum bezeichnet. Wahrend die Knoten die Teilprobleme darstel- 
len, reprasentieren die Kanten die Nachfolgebeziehung. Alle Knoten, welche die 
gleiche Entfernung zum Ursprung des Branch-and-Bound-Baumes, der sog. Wurzel, 
aufweisen, bilden eine Stufe. 

Um die Menge der zu bearbeitenden Knoten eines Branch-and-Bound-Baumes 
gering zu halten, wird das Prinzip des Bounding angewendet. Hiernach muE ein 
Teilproblem 166 Pj nicht weiterverzweigt werden, wenn 

1. Pj keine zulassige Losung besitzt oder 

2. es eine zulassige Losung von P 0 gibt, deren Bounding-Funktion einen besseren 
Wert liefert als die Bounding-Funktion vom Teilproblem P ir oder 

3. Pj eine zulassige Losung von P 0 ist. 

Die Bounding-Funktion g ist hierbei so zu wahlen, daE folgende Bedingungen erfiillt 
sind: 167 

1. g(Pj) > f(Pj) fur alle F { e V 

2. g(Pi) = f(Pi) fur alle Pj e V B 

3. g(Pj) < g(Pj) falls Pj Nachfolger von Pj in V 

wobei f der Zielfunktionswert der Teilprobleme ist. Zumeist wird der Zielfunk- 
tionswert selbst als Bounding-Funktion herangezogen. 

Das Prinzip des Bounding besitzt eine groEe Bedeutung fur die Rechenbarkeit 
gemischt-ganzzahliger linearer Optimierungsmodelle. Ist die Anzahl der im 
schlechtesten Fall zu berechnenden Knoten (worst case) aufgrund der kombinatori- 
schen Komplexitat des Modells sehr hoch, fiihrt auch eine Anzahl von tatsachlich zu 
berechnenden Knoten im Bereich von weniger als einem Prozent zu einem erhebli- 
chen Rechenaufwand. Praxisrelevante Problemstellungen fiihren leicht zu 1 Milli- 
arde im schlechtesten Fall zu berechnender Knoten. Miissen davon tatsachlich z.B. 
nur 0.01 %, also 100000 Knoten, bearbeitet werden und dauert die Berechnung jedes 
einzelnen Knotens nur 1 sec, betragt der Gesamtrechenaufwand immer noch rund 28 
Stunden. Erschwerend kommt hinzu, daE mit einer hohen kombinatorischen Kom- 
plexitat i.a. ebenfalls eine Erhohung der Komplexitat fur den kontinuier lichen 
Bereich verbunden ist. Es muE deshalb neben der Knotenanzahl auch der Zeitauf- 
wand fiir die Berechnung jedes einzelnen Knotens minimiert werden. 



166 i m folgenden werden die Begriffe Knoten und Teilproblem synonym verwendet. 

167 schon i m Kapitel 2 erlautert, wird von einem Maximierungsproblem ausgegangen. 
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4.2. Komponenten des speziellen Branch-and-Bound-Algorithmus 

Im folgenden wird ein Branch-and-Bound-Algorithmus beschrieben, der insbeson- 
dere fur die Abarbeitung von SOS des Typs 1 entwickelt worden ist und damit zur 
Losung des im Kapitel 2 vorgestellten dynamischen Produktionsplanungsproblems 
herangezogen werden kann. Der Branch-and-Bound-Algorithmus ist jedoch auch in 
der Lage, beliebige binare bzw. gemischt-binare Optimierungsprobleme zu losen, da 
er jede einzelne, nicht in einen SOS eingebundene Binarvariable als zweiwertigen 
SOS interpretieren kann. 

Ein spezieller Branch-and-Bound-Algorithmus ist durch 

- die verwendete Relaxation, 

- die verwendete Suchstrategie, 

- die verwendete Verzweigungsregel, 

- die Abarbeitungsreihenfolge, in der die ganzzahligen Variablen behandelt 
werden, sowie 

- ggf. durch die verwendeten Pseudokosten und geschatzten Zielfunktionswerte 
gekennzeichnet. 

4.2.1. Relaxation 

Die Lockerung oder das Weglassen von Nebenbedingungen in einem Optimie- 
rungsproblem P fuhrt zu einem neuen Optimierungsproblem P R , das als relaxiertes 
Problem bezeichnet wird. Fiir die Losungsmengen beider Probleme gilt: 

L(P) C L(P r ) (4.4) 

In dem Branch-and-Bound-Baum sind alle Nicht-Blattknoten relaxierte Probleme P R 
und die Blattknoten stellen die moglichen Losungen von P dar. Die Nachfolger eines 
Knotens entstehen jeweils durch das Hinzufiigen weggelassener Nebenbedingun- 
gen. Die sich aus der Relaxation ergebenden Zielfunktionswerte der Probleme P R 
dienen als Bounding-Funktion. 
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Zur Abbildung eines binaren SOS treten, wie schon im Kapitel 2 gezeigt, folgende 
Bedingungen auf: 

Xyi = 1 (4.5) 

i=l 

yj s {0,1} V i=l,...,n (4.6) 

Ein kontinuierlicher SOS lafit sich nur mit Hilfe eines binaren SOS, also durch die 
Bedingungen (4.5) und (4.6), und den zusatzlichen Bedingungen 

Xj < M yi V i=l,...,n (4.7) 

xj > 0 V i=l,...,n (4.8) 

abbilden. Die Bedingung (4.7) stellt hierbei die Verbindung zwischen den binaren 
und den kontinuierlichen Variablen her. 

Fur den binaren SOS besteht die Relaxation in der Lockerung der 0/1-Bedingung fur 
die Variablen des binaren SOS. 168 Die For derung, dafi die Summe der SOS-Varia- 
blen den Wert 1 ergeben soil, bleibt dabei aufrechterhalten, wahrend die Ganzzah- 
ligkeitsbedingung (4.6) fur die beteiligten SOS- Variablen fallengelassen wird. 

Dient der binare SOS zur Abbildung eines kontinuierlichen SOS, bestehen zwei 
Moglichkeiten der Relaxation, die eben beschriebene einfache Relaxation und eine 
erweiterte Relaxation, bei der gleichzeitig mit dem Weglassen der Ganzzahligkeits- 
bedingung auch die Nebenbedingung (4.7) relaxiert wird. 

Diese erweiterte Lockerung hat zur Folge, dafi automatisch die Ganzzahligkeitsbe- 
dingung bei den binaren SOS erfiillt ist, wahrend die relaxierte Bedingung (4.7) 
nicht mehr erfiillt ist. Es kann somit mehr als eine Variable innerhalb eines kontinu- 
ierlichen SOS einen Wert grofier als 0 annehmen. Wird hingegen bei einem kontinu- 
ierlichen SOS auf eine Relaxation der Bedingung (4.7) verzichtet, ist zwar gewahr- 
leistet, dafi die Bedingung erfiillt ist. Dafiir ist aber die Ganzzahligkeitsbedingung 
des binaren SOS nicht mehr erfiillt. 



168 Das Weglassen der Ganzzahligkeitsbedingung ist die gangige Relaxation fur ganzzahlige bzw. 
gemischt-ganzzahlige Optimierungsmodelle. 
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4.2.2. Verzweigungsregel 

Die Verzweigungsregel bestimmt die Anzahl der Nachfolgeknoten der Nicht-Blatt- 
knoten eines Branch-and-Bound-Baumes. Grundsatzlich kann der Branch-and- 
Bound-Baum die Gestalt eines Binarbaumes oder eines Mehrfachbaumes annehmen. 



Zur Darstellung der entsprechenden Verzweigungsregeln werden einige Definitio- 
nen und Symbole bendtigt. 

Definition 4.1: Eine Variable heifit fixiert, wenn sie vor dem linearen Optimie- 

rungsprozefi auf einen bestimmten Wert gesetzt worden ist. 
Eine Variable ist demnach nicht fixiert, wenn sie ihren Wert 
erst durch den Optimierungsprozefi erhalt. 

Definition 4.2: Ein kontinuierlicher SOS heifit erfiillt, wenn sowohl der binare 

SOS als auch die Bedingung fiir die Relation zwischen kontinu- 
ierlichen und binaren SOS-Variablen erfiillt sind. 



Definition 4.3: Die SOS-Bedingung heifit fiir eine binare Variable erfiillt, wenn 

die binare Variable den Wert 0 oder 1 annimmt. Die SOS-Be- 
dingung heifit fiir eine kontinuierliche Variable erfiillt, wenn 
entweder die binare und die kontinuierliche Variable beide den 
Wert 0 annehmen oder aber die binare Variable den Wert 1 
und die kontinuierliche Variable einen beliebigen Wert an- 
nimmt. 



Definition 4.4: 
Definition 4.5: 

Definition 4.6: 



Der Umfang eines SOS ist die Anzahl der Variablen des SOS. 

Die Machtigkeit eines relaxierten SOS ist die Anzahl der SOS- 
Variablen, fiir die die SOS-Bedingung nicht erfiillt ist. 

Der Zustand eines erfiillten SOS ist die Position der Nichtnull- 
Variablen innerhalb des SOS. 



Die Symbole lauten: 

n 

j-<=j 

u = {l,...,u*} 

UjcU 



Indexmenge der SOS 
Indexmenge der nichterfiillten SOS 
Indexmenge der SOS-Variablen 
Indexmenge der SOS-Variablen des SOS j 
Umfang des SOS j 
Machtigkeit des SOS j 
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Menge aller moglichen Teilungspunkte eines SOS j 
Teilungspunkt des SOS j 
Menge aller moglichen Zustande eines SOS j 
Zustand des SOS j 

i-te SOS- Variable einer vorgegebenen Reihenfolge 



4.2.2.I. Verzweigungsregel ’Binarbaum’ 

Die Verzweigungsregel 'Binarbaum' (Binarverzweigung) verzweigt an jedem Nicht- 
Blattknoten in einen linken und einen rechten Nachfolgeknoten. Hierzu wird die 
Menge der SOS-Variablen des betrachteten SOS in zwei Mengen zerlegt. Die eine 
Menge besteht aus denjenigen SOS-Variablen, die auf Null fixiert werden sollen, 
und die andere Menge aus denjenigen Variablen, fur die keine Fixierung vorgenom- 
men werden soil. 

Im Falle der erweiterten Relaxation eines kontinuierlichen SOS umfafit die Menge 
der zu fixierenden Variablen nicht nur die binaren SOS-Variablen, sondern auch die 
mit ihnen in Verbindung stehenden kontinuierlichen Variablen. 

Es besteht die Moglichkeit, vor dem Optimierungsprozefi eine Einteilung vorzuge- 
ben (fester Teilungspunkt) oder aber im Laufe der Baumabarbeitung fur jeden 
betrachteten Knoten die Aufteilung fur die beiden Nachfolgeknoten in Abhangigkeit 
von dem Ergebnis der jeweiligen linearen Optimierung zu bestimmen (variabler 
Teilungspunkt) . 



4.2.2.I.I. Verzweigungsregel ’Binarbaum mit festem Teilungspunkt’ 

Sei m die Machtigkeit des ausgewahlten SOS und r ein vorgegebener Teilungspunkt 
mit r < m. Dann werden fur den linken Nachfolgeknoten die in der Reihenfolge der 
bisher nicht fixierten Variablen ersten Tm/rl Variablen auf Null fixiert und die letz- 
ten Lm/rJ Variablen nicht fixiert und fur den rechten Nachfolgeknoten umgekehrt 
die ersten Tm/rl Variablen nicht fixiert und die letzten Lm/rJ Variablen auf Null 
fixiert. 

Die Zahl n wc der im schlechtesten Fall zu berechnenden Knoten lafit sich vor dem 
Optimierungsprozefi bestimmen: 



: = I 

j*J 



( 2u j - 2 )fl u i-i 
1=1 



(4.9) 
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Die Abbildung 6 zeigt fur einen SOS mit Umfang u*=5 das Ergebnis einer nach der 
Verzweigungsregel 'Binarbaum mit festem Teilungspunkt' durchgefiihrten Zerle- 
gung mit Teilungspunkt r=2. 




Abbildung 6: Verzweigungsregel 'Binarbaum mit festem Teilungspunkt' 

4.2.2.I.2. Verzweigungsregel ’Binarbaum mit variablem Teilungspunkt' 

Liegt ein binarer SOS vor, wird jeder binaren SOS-Variablen ein Gewicht zugeord- 
net. Im folgenden wird hierfiir die Bezeichnung 'binare Gewichtung' verwendet. Bei 
einem kontinuierlichen SOS besteht zum einen ebenfalls die Moglichkeit, den bina- 
ren SOS-Variablen, die zur Abbildung eines kontinuierlichen SOS dienen, ein 
Gewicht zuzuordnen. Zum anderen kann aber auch jeder kontinuierlichen SOS- 
Variablen selbst ein Gewicht zugeordnet werden. 169 In diesem Fall wird von einer 
'kontinuierlichen' Gewichtung gesprochen. 



169 Der Fall binarer SOS wird z.B. beschrieben in: Gauthier, J.-M., Ribiere, G.: Experiments in 
Mixed-Integer Linear Programming using Pseudo-costs, Mathematical Programming, Vol. 12, 
1977, S. 26-47, hier S. 40 
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Die Variablen eines SOS werden anschliefiend in absteigender Reihenfolge ihrer 
Wichtung innerhalb des binaren bzw. des kontinuier lichen SOS angeordnet. 

Wj_i>Wj>Wi + i V je J, i=2,...,Uj-l (4.10) 

Fur den Teilungspunkt jedes SOS j wird ein Index rj gesucht, fur den gilt: 

w rj >w*>w rj+1 V je J mit j<j* (4.11) 

wobei 



X w i x i 




ueUj 



Vj€j 



(4.12) 



Analog zu der Verzweigung mit festem Teilungspunkt werden gemafi der vorgege- 
benen Reihenfolge fur den linken Nachfolgeknoten die ersten r Variablen auf Null 
fixiert und die letzten Variablen nicht fixiert und fiir den rechten Nachfolgeknoten 
umgekehrt. 

Die Vorgehensweise bei der Bestimmung des Teilungspunktes gilt gleichermafien 
fiir binare und fiir kontinuierliche SOS. Im Falle der erweiterten Relaxation ist es je- 
doch bei einem kontinuierlichen SOS nur sinnvoll, den Teilungspunkt auf Basis der 
kontinuierlichen SOS zu bestimmen, da die binaren SOS automatisch erfullt sind. 

In der Abbildung 7 findet sich fur einen SOS mit Umfang u*=5 das Ergebnis einer 
nach der Verzweigungsregel 'Binarbaum mit variablem Teilungspunkt' durchge- 
fiihrten Zerlegung. 

Die Gewichtung der SOS-Variablen eines SOS kann entweder willkiirlich geschehen 
Oder auf der Basis von Informationen, die das Modell liefert. 170 Zu diesen Informa- 
tionen zahlen z.B. die Zielfunktionskoeffizienten oder die Koeffizienten von Neben- 
bedingungen, in denen die betrachteten SOS-Variablen vorkommen. 



170 Forrest, J.J.H., Hirst, J.P.H., Tomlin, J.A.: Practical Solution of Large Mixed Integer Program- 
ming Problems with UMPIRE, Management Science, Vol. 20, Nr. 5, Theory Series, 1974, S. 736- 
773, hier S. 767 
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Abbildung 7: Verzzveigungsregel 'Binarbaum mit variablem Teilungspunkt' 

In dem im Kapitel 2 vorgestellten dynamischen Produktionsplanungsproblem wird 
fur jede Maschine durch einen SOS festgelegt, welche Produkte jeweils auf welchen 
Produktionsstufen auf dieser Maschine gefertigt werden konnen. Da bei der Zielset- 
zung Gewinnmaximierung vorzugsweise diejenigen Produkte gefertigt werden, die 
einen hohen Gewinn bringen, erscheint es sinnvoll, fur die Gewichtung der SOS- 
Variablen die entsprechenden Zielfunktionskoeffizienten heranzuziehen. 

Bei dem Produktionsplanungsmodell mit Durchlaufzeitminimierung werden im 
Gegensatz zur Gewinnmaximierung vorzugsweise diejenigen Produkte gefertigt, die 
moglichst viel in moglichst geringer Zeit fertigen. Es bieten sich daher in diesem Fall 
die Produktionskoeffizienten als Gewichte an. 

Die Zahl der im schlechtesten Fall zu berechnenden Knoten laBt sich bei der Ver- 
zweigungsregel 'Binarbaum mit variablem Teilungspunkt' nicht im vorhinein be- 
stimmen, da die Teilungspunkte erst im Laufe des Optimierungsprozesses ermittelt 
werden. 
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4.2.2.2. Verzweigungsregel 'Mehrfachbaum 1 

Bei der Verzweigungsregel 'Mehrfachbaum' (Mehrfachverzweigung) wird nach den 
moglichen Zustanden eines SOS verzweigt. 171 Hierzu werden fiir einen Zustand Zj 
eines SOS j alle binaren SOS-Variablen y u , ueUj mit u*Zj, auf Null fixiert und im 
Falle der erweiterten Relaxation, genau wie bei der Verzweigungsregel 'Binarbaum', 
alle dazu in Relation stehenden kontinuierlichen Variablen x u , ue Uj mit u^zj. 

Jeder Stufe des Branch-and-Bound-Baumes entspricht ein SOS. Der Branch-and- 
Bound-Baum hat somit genauso viele Stufen wie SOS in dem zugrunde gelegten 
Modell vorkommen. Ausgehend vom Anfangsknoten wird in der ersten Stufe nach 
den moglichen Zustanden des in der Sortierreihenfolge ersten SOS verzweigt, in der 
zweiten Stufe nach den Zustanden des in der Sortierreihenfolge zweiten SOS, in der 
dritten Stufe nach den Zustanden des in der Sortierreihenfolge dritten SOS, usw.. 
Das bedeutet, dafi jeder Nicht-Blattknoten des Baumes als Nachfolger die moglichen 
Zustande des in der Sortierreihenfolge nachsten SOS besitzt. 

Die Abbildung 8 zeigt einen Ausschnitt eines nach der Verzweigungsregel 
'Mehrfachbaum' verzweigten Baumes mit einem SOS des Umfangs uj=4 und einem 
SOS des Umfangs U2=3. 




Abbildung 8: Verzweigungsregel 'Mehrfachbaum' 



Da die Anzahl der moglichen Zustande fiir jeden SOS bekannt ist, lafit sich hier die 
Zahl der im schlechtesten Fall zu berechnenden Knoten im vorhinein bestimmen. 



Es wird davon ausgegangen, dafi die Anzahl der moglichen Zustande grofier als 2 ist. 
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n wc=x(rK) ( 4 - i3 > 

jej 1=1 

4.2.3. Suchstrategie 

Die Abarbeitungsreihenfolge des Branch-and-Bound-Baumes, also die Reihenfolge, 
in der die Knoten des Baumes behandelt werden, ist durch die gewahlte Suchstrate- 
gie bestimmt. Hierbei ist eine Breitensuche (breadth-first), eine Tiefensuche (depth- 
first), eine Suche nach dem besten Zielfunktionswert (best-first), eine Zufallssuche 
oder eine Kombination aus zwei oder mehreren dieser Strategien moglich . 172 

Die Kombination verschiedener Suchstrategien soil zu einer Nutzung der Vorteile 
unter gleichzeitiger Verringerung der Nachteile der entsprechenden eingesetzten 
Strategien fuhren. Da die Zeit, die der vorliegende Branch-and-Bound-Algorithmus 
insgesamt zur Losung eines ganzzahligen bzw. gemischt-ganzzahligen Problems be- 
notigt, zum einen von der Knotenanzahl und zum anderen vom Aufwand fur die 
Bearbeitung jedes einzelnen Knotens abhangt, lafit sich dieses Ziel nur erreichen, 
wenn eine Suchstrategie, die eine im Verhaltnis zu den anderen Strategien geringe 
Knotenanzahl garantiert, mit einer Suchstrategie, die einen geringen Aufwand fur 
die Bearbeitung eines Teilproblems verspricht, kombiniert wird. 

Die Giite der Strategie bzgl. der Knotenanzahl lafit sich anhand der tatsachlich und 
der im besten Fall zu berechnenden Knoten beurteilen. Die Anzahl der im besten 
Fall zu berechnenden Knoten ergibt sich, wenn bei der zu beurteilenden Suchstrate- 
gie der optimale Zielfunktionswert als Bound vorgegeben wird. In diesem Fall wer- 
den nur Knoten berechnet, deren Wert grofier ist als der optimale Zielfunktionswert, 
oder Knoten, fur deren Vorganger dieses gilt. Die Differenz zwischen den im 
schlimmsten und im besten Fall zu berechnenden Knoten liefert die Anzahl der 
iiberfliissigen Knoten. 

Im Falle der best-first-Suche miissen grundsatzlich keine iiberfliissigen Knoten bear- 
beitet werden, da hier nur Knoten berechnet werden, deren Wert grofier ist als der 
optimale Zielfunktionswert, oder Knoten, fur deren Vorganger dieses gilt. Bei der 
Tiefensuche werden, wenn es sehr lange dauert, bis der optimale Zielfunktionswert 



I 72 Breitensuche bedeutet, dafi zunachst alle Knoten einer Stufe berechnet werden, bevor zur nach- 
sten Stufe verzweigt wird. Bei der Tiefensuche wird nach der Berechnung eines Knotens der 
Nicht-Blattebene sofort ein Nachfolgeknoten behandelt. Ist die Blattebene erreicht, wird mog- 
lichst tief im Baum weitergegangen. Bei der Suche nach dem besten Zielfunktionswert wird stets 
bei dem Knoten fortgefahren, der von den noch zu bearbeitenden Knoten den besten Zielfunkti- 
onswert besitzt. Die Zufallssuche bestimmt den nachsten zu bearbeitenden Knoten auf der Basis 
einer Zufallszahl, die mit Hilfe eines Zufallszahlengenerators erzeugt wird. 
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erreicht wird, sehr viele iiberfliissige Knoten berechnet. Dieses gilt i.d.R. in noch 
starkerem Mafie fur die Breitensuche, da es hier im Gegensatz zur Tiefensuche zu- 
meist noch langer dauert, bis der optimale Wert erreicht wird. Auch bei der Zufalls- 
suche ist es nicht gewahrleistet, dafi keine uberfliissigen Knoten berechnet werden 
miissen. 

In einem Branch-and-Bound-Algorithmus, der mit einer LP-Relaxation arbeitet, 
spiegelt sich der Aufwand fiir die Bearbeitung eines Teilproblems in der Anzahl 
Pivotschritte, die zur Erreichung des LP-Optimums oder zum Beweis der Unzulas- 
sigkeit notwendig sind, wider . 173 Werden hintereinander zwei ahnliche Probleme 
bearbeitet, lafit sich die Zahl der Pivotschritte drastisch reduzieren, wenn bei der LP- 
Optimierung des zweiten Problems nicht mit einer neuen Basis begonnen wird, son- 
dern auf der Basis des zuerst berechneten Problems wiederaufgesetzt wird . 174 Zwei 
Probleme werden in diesem Zusammenhang als ahnlich bezeichnet, wenn das eine 
Problem durch Hinzufiigen von wenigen Nebenbedingungen aus dem anderen 
Problem hervorgeht oder wenn bei dem einen Problem gegeniiber dem anderen 
Problem nur wenige Variablen auf einen anderen Wert fixiert werden. 

Wahrend bei der best-first-Suche und der Zufallssuche nur jeweils bei den unmittel- 
baren Nachfolgern eines ausgewahlten Knotens gewahrleistet ist, dafi hintereinander 
ahnliche Probleme bearbeitet werden, ist dieses bei der Breitensuche und insbeson- 
dere bei der Tiefensuche in grofierem Umfang der Fall . 175 

Unter der Beriicksichtigung der Vor- und Nachteile der einzelnen Strategien er- 
scheint eine Kombination aus best-first- und Tiefensuche am erfolgversprechend- 
sten . 176 Hierbei werden ausgehend von einem Knoten alle unmittelbaren Nachfolger 
bestimmt und anschliefiend wird der beste Nachfolger als erneuter Ausgangsknoten 
gewahlt. Ist die Blattebene erreicht, wird der beste der noch zur Verfiigung stehen- 
den Knoten als neuer Ausgangsknoten gewahlt. 



173 Boehning, R.L., Butler, R.M., Gillet, B.E.: A parallel integer linear programming algorithm, 
EJOR, Vol. 34, 1988, S. 393-398, hier S. 395 

174 Hillier, F.S., Liebermann, G.J.: a.a.O., S. 87 

175 So ist es z.B. aufgrund der guten Wiederaufsetzmoglichkeit bei der Tiefensuche moglich, dafi 
trotz hoherer Knotenanzahl als bei der best-first-Suche die Anzahl der insgesamt fiir die Be- 
stimmung der optimalen ganzzahligen Losung benotigten Pivotschritte geringer ist. 

17 6 Diese kombinierte Suchstrategie wird auch in kommerziellen Software-Paketen, wie z.B. 
MPSX/370 Version 2 von IBM eingesetzt. 
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4.2.4. Sortierfunktion 

Die Reihenfolge, in der die SOS abgearbeitet werden, beeinflufit entscheidend die 
Anzahl der insgesamt zu berechnenden Knoten, so dafi davon ausgegangen werden 
kann, dafi die SOS im Hinblick auf das Losungsverhalten eine unterschiedliche 
Bedeutung besitzen. In der Tabelle 6 findet sich fiir verschiedene Abarbeitungsrei- 
henfolgen der SOS bei gleicher Suchstrategie und Verzweigungsregel die Anzahl der 
zu berechnenden Knoten. Hierbei zeigt sich, dafi die Zahlen sehr stark differieren. Es 
mufi daher ein MaB fiir die Relevanz eines SOS gefunden werden, das es ermoglicht, 
eine Sortierreihenfolge zu bestimmen, die zu einer moglichst geringen Zahl zu bear- 
beitender Knoten fiihrt. 



Reihenfolge 


Knotenanzahl 


123456 


666 


135246 


74 


246135 


148 


654321 


506 


642531 


120 


531642 


78 


162534 


640 


123654 


496 



Tabelle 6: Knotenanzahl bei verschiedenen Sortierreihenfolgen der SOS 177 



Eine einfache Moglichkeit besteht darin, als Mali fiir die Bedeutung B eines SOS 
seinen Umfang zu nehmen. 



B j =u j 



VjEj 



(4.14) 



Die SOS werden dann nach absteigendem Umfang und bei gleichem Umfang in der 
durch das Modell gegebenen Reihenfolge abgearbeitet. Dadurch wird eine friihe 



I 77 Fiir die Ermittlung der Knotenanzahlen wurde das Modell A3010301 (wird im Kapitel 7 noch 
vorgestellt) mit folgender Verfahrensvariante herangezogen: U/V-Formulierung mit einfacher 
Relaxation, best-first-Suche, binare Verzweigung, Teilungspunkt auf der Basis eines binaren 
SOS, kontinuierliche Gewichtung. 
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Fixierung von moglichst vielen Variablen erreicht, die zum einen schnell zu einer 
Modellreduzierung fiihrt und zum anderen schneller Unzulassigkeiten auftreten 
laBt, so daB die Zahl der zu berechnenden Knoten und der Aufwand fur die Berech- 
nung jedes einzelnen Knotens verringert werden. 

Eine weitere Moglichkeit ist dadurch gegeben, daB die Zielfunktions- 178 oder die 
Nebenbedingungskoeffizienten d der betreffenden SOS- Variablen als MaB fur die 
Relevanz herangezogen werden. 

Bj= X VjeJ (4.15) 

IT U- 



Die SOS werden auch hier in abnehmender Reihenfolge ihrer Bedeutung gewahlt. Ist 
ein in der Reihenfolge nachster SOS schon erfiillt, wird der nachste in der Reihenfol- 
ge nichterfiillte SOS gewahlt. 

Beide Varianten bestimmen die Abarbeitungsreihenfolge vor dem Optimierungs- 
prozeB. Wird als MaB der Grad der Nichterfullung eines SOS genommen, so ergibt 
sich die Reihenfolge erst im Laufe des Optimierungsprozesses. 179 Welcher SOS im 
Nachfolgeknoten bearbeitet wird, folgt einzig und allein aus der konkreten Varia- 
blenauspragung des gerade behandelten Knotens. 

Der Grad der Nichterfullung eines SOS laBt sich anhand der Abweichung A zwi- 
schen der SOS- Variablen mit dem groBten Anteil am Gesamtwert und dem Gesamt- 
wert des SOS messen: 180 



X x u ~ max (x u ) 



A; 



ueU 



ugU 



X x u 
ue Uj 






max (x u ) 
ue Ui 



X x u 



V je J 



ue Ui 



(4.16) 



Ist diese Abweichung fiir einen nichterfiillten SOS j geringer als eine vorgegebene 
Toleranz TOL, d.h. gilt 



* 78 Gauthier, J.-M., Ribiere, G.: a.a.O., hier S. 41 

I 79 Das Konzept des Erfiillungsgrades findet sich in der Literatur insbesondere fiir den allgemeinen 
Fall binarer Variablen; es wird jedoch auch auf SOS angewendet, wobei allerdings lediglich 
binare SOS betrachtet werden. Vgl. hierzu: Gauthier, J.-M., Ribiere, G.: a.a.O., hier S. 34 und 41; 
Forrest, J.J.H., Hirst, J.P.H., Tomlin, J.A.: a.a.O., hier S. 768 

1«0 Der Fall binarer SOS ist als Spezialfall enthalten. 
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max (x u ) 

Aj=l--^i < TOL VjeJ- (4.17) 

2> u 
ue Uj 

wird dieser SOS als quasierfiillt bezeichnet. 

Um den Zielfunktionswert moglichst schnell zu reduzieren und dadurch schneller 
Knoten abschneiden zu konnen, werden die SOS in der Reihenfolge sinkender 
Abweichungen behandelt, so dafi die quasierfiillten SOS erst dann behandelt 
werden, wenn alle nicht quasierfiillten SOS schon erfiillt sind. 

4.2.5. Geschatzte Zielfunktionswerte 

Wenn es moglich ware, bei der kombinierten Suche vor der Bearbeitung eines Teil- 
baums den maximal erreichbaren Zielfunktionswert der Blattebene zu berechnen, 
liefie sich sehr schnell die optimale Losung finden. 

Ein Versuch, am Anfang eines Teilbaums zu bestimmen, wie hoch der Zielfunk- 
tionswert am Ende des Teilbaums ist, besteht in der Berechnung von geschatzten 
Zielfunktionswerten 181 . Sie stellen einen Schatzwert fiir die Hohe des noch in dem 
betrachteten Teilbaum zu erreichenden Zielfunktionswertes dar. Ihre Berechnung 
kann entweder auf der Basis von sogenannten Pseudokosten oder von Kosten der 
Nichterfiillung erfolgen. 

Fur die Berechnungsvorschriften im Zusammenhang mit der Ermittlung der 
geschatzten Zielfunktionswerte werden folgende Symbole benotigt: 

Ffc Zielfunktionswert eines beliebigen Knotens k, bei 

dem der Teilungspunkt rj bzw. der Zustand Zj noch 
nicht realisiert worden ist 

F n+ i Zielfunktionswert des linken Nachfolgeknotens von 

k, bei dem der Teilungspunkt rj realisiert worden ist 

F n+ 2 Zielfunktionswert des rechten Nachfolgeknotens von 

k, bei dem der Teilungspunkt rj realisiert worden ist 

F n+Z . Zielfunktionswert des Nachfolgeknotens von k, bei 

dem der Zustand Zj realisiert worden ist 

x u Werte der SOS-Variablen 



1^1 Gauthier, J.-M., Ribiere, G.: a.a.O., hier S. 30 
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PCL,. 

r ) 

PCU r . 

r ) 

PC Z . 

z ) 

degLrj 

degU r . 

de gzj 

E 

S m 

A. 

F 0 

Fi 



Werte der SOS- Variablen im Knoten m 

Pseudokosten des SOS j fur den Teilungspunkt rj 
bzgl. der Teilmenge { ie U I i < r j } 

Pseudokosten des SOS j fur den Teilungspunkt rj 
bzgl. der Teilmenge { ie U I i > r j } 

Pseudokosten des SOS j fur den Zustand Zj 

geschatzte Degradation des SOS j fur den Teilungs- 
punkt rj bzgl. der Teilmenge { ie U I i < r j } 

geschatzte Degradation des SOS j fur den Teilungs- 
punkt Tj bzgl. der Teilmenge { ie U I i > r j } 

geschatzte Degradation des SOS j fur den Zustand Zj 

geschatzter Zielfunktionswert, der ausgehend vom 
Knoten m noch erreicht werden kann 

Grad der Unzulassigkeit im Knoten m 
Kosten der Nichterfiillung 
Zielfunktionswert der kontinuierlichen Losung 

Zielfunktionswert einer ganzzahligen bzw. 
gemischt-ganzzahligen Losung 



4.2.5.I. Pseudokosten 

Die Pseudokosten driicken bezogen auf einen Teilungspunkt oder Zustand die Ver- 
schlechterung des Zielfunktionswertes pro Einheit der Veranderung des durch den 
Teilungspunkt bzw. Zustand gegebenen Wertes des SOS aus. Sie lassen sich ebenso 
wie der Erfiillungsgrad sowohl im Zusammenhang mit beliebigen ganzzahligen 
Variablen als auch mit SOS bestimmen. Je nachdem, ob sie fur einen Binar- oder 
einen Mehrfachbaum ermittelt werden sollen, ergeben sich unterschiedliche Berech- 
nungsvorschriften . 182 Ferner ist die Berechnung sowohl auf der Basis binarer als 
auch auf der Basis kontinuierlicher SOS- Variablen moglich. In beiden Fallen mufi 
der Gesamtwert eines SOS zur Berechnung herangezogen werden. 



I 82 In der Literatur finden sich Berechnungsvorschriften fur den Fall eines Binarbaums auf der 
Grundlage binarer SOS. Vgl. hierzu z.B.: Gauthier, J.-M., Ribiere, G.: a.a.O., hier S. 40 
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Wahrend der Gesamtwert bei den binaren SOS immer den Wert 1 annimmt, kann er 
bei den kontinuierlichen SOS sehr unterschiedlich sein. Es ist jedoch leicht zu sehen, 
dafi der binare Fall ein Spezialfall des kontinuierlichen Falls ist, so dafi er im folgen- 
den nicht explizit behandelt wird. 

Gesamtwert = ^x u (4.18) 

ueUj 

Im Falle des Binarbaums miissen die Pseudokosten fiir jeden moglichen Teilungs- 
punkt eines SOS j bzgl. der Teilmengen { ie U I i < rj } und { ie U I i > rj ) bestimmt 
werden. 



(Fk-Fn+l) 5>u (Fk-Fn+l) ^ 



ueU 



PCLrj= 



ueU; 



x*r 



i<r; 



i<r, 



(Fk-Fn +2 ) Ix k u (F k -F n+2 ) 



PCU rj 



ueUi 



ueUj 






n+2 



X 4 

i>r j 



V Tj6 Rj (4.19) 



V fjsRj (4.20) 



Soli nun in einem Knoten m geschatzt werden, wie sich der Zielfunktionswert ver- 
schlechtert, wenn fiir einen SOS j ein Teilungspunkt rj realisiert wird, so wird der 
Wert des SOS beziiglich dieses Teilungspunktes mit den Pseudokosten bewertet, d.h. 
es werden die beiden geschatzten Degradationen 



i-i” 



d e gL rj ~ PCL r . 



i<rj 



ueUj 



degU, = PCU r . 



i^3 

XC 

ugUj 



Vr je R, (4.21) 



VrpRj (4.22) 



berechnet, wobei der Wert eines SOS j fiir einen beliebigen Teilungspunkt rj definiert 
ist als 
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X*. 

lz!L_ 

X*v 



X*i 

bzw. 

UG Uj 




Vr jeRj 



(4.23) 



Soil nun fur einen Nicht-Blattknoten der geschatzte Zielfunktionswert berechnet 
werden, so ergibt sich dieser aus folgender Formel: 

E m = F m - X min ( de 8 L rj ' de g U rj ) V me V N (4.24) 

) el - 



Im Falle eines Mehrfachbaums miissen beziiglich jedes moglichen Zustands eines 
SOS Pseudokosten berechnet werden. 



(F k -F n+ ) Xx^ 



PC, 



UG U 



x *$- x*r 

UG U j UG Uj 



(F k -F n+Zj ) 

UG Uj 

UG Uj 
U^Zj 



VzjGZj (4.25) 



Hieraus ergeben sich die geschatzten Degradationen fiir einen SOS j wie folgt: 



x-c 



ueU 



de Szj 



= PC, 



u*z\ 



’ Xx m 

jLu u 

U G Uj 



VzjGZj (4.26) 



Die Berechnungsvorschrift fiir die geschatzten Zielfunktionswerte lautet: 

E m = F m - X min ( de Szj ) V me V N (4.27) 

. z; e Zj ’ 



Es mu6 auch hier, genauso wie bei der Bestimmung des Teilungspunktes, beachtet 
werden, dafi in dem Fall, wo sowohl binare als auch kontinuierliche SOS relaxiert 
werden, Pseudokosten und geschatzte Zielfunktionswerte nur sinnvoll auf der Basis 
kontinuierlicher SOS berechnet werden konnen, da die binaren SOS grundsatzlich 
aufgrund der Modellogik erfiillt sind. 

Bei der Berechnung der Pseudokosten stellt sich das Problem, dafi im Laufe der 
Baumabarbeitung ein Teilungspunkt oder ein Zustand fiir einen SOS nicht nur ein- 
mal, sondern insbesondere im Falle eines Mehrfachbaums haufiger realisiert wird. 
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Daraus ergeben sich verschiedene Vorgehensweisen. Zum einen konnen die Pseu- 
dokosten bei wiederholtem Auftreten eines Teilungspunktes oder Zustands jedesmal 
neu bestimmt werden und dann z.B. statt der zuvor ermittelten Pseudokosten oder 
als Durchschnitt aus alien bisher berechneten Pseudokosten in die geschatzten De- 
gradationen eingehen. Zum anderen ist es auch denkbar, daP die Pseudokosten nur 
beim ersten Auftreten eines Teilungspunktes oder Zustands berechnet werden . 183 

Als weiteres Problem stellt sich, daP insbesondere am Anfang der Bearbeitung noch 
nicht alle fur die Ermittlung eines geschatzten Zielfunktionswertes benotigten Pseu- 
dokosten berechnet sind. In diesem Fall konnen entweder die noch nicht zur Verfu- 
gung stehenden Pseudokosten auf Null gesetzt werden 184 , Schatzwerte fur die 
Pseudokosten gewahlt werden oder aber sogenannte Zusatz-Pseudokosten bestimmt 
werden. 

Die Schatzung von Pseudokosten ist als problematisch anzusehen, da in der Regel 
keine Informationen hierfiir vorliegen. Dieser Ansatz wird deshalb nicht weiter 
verfolgt. 

Fur die Berechnung der Zusatz-Pseudokosten wird ausgehend vom aktuellen 
Knoten die Zerlegung gemaP dem gewiinschten Teilungspunkt oder Zustand reali- 
siert 185 und anschliePend werden die daraus resultierenden Pseudokosten berech- 
net. 

Werden keine Zusatz-Pseudokosten ermittelt, so ist es sinnvoll, eine Uberarbeitung 
der bisher schon vorliegenden geschatzten Zielfunktionswerte vorzunehmen, wenn 
Pseudokosten, die noch nicht zur Verfiigung gestanden haben, berechnet worden 
sind. Dieses kann entweder sofort erfolgen oder aber zu fest definierten Zeitpunk- 
ten, wie z.B. immer am Ende eines Teilbaums, wobei die sofortige Anderung in der 
Regel einen hohen Aufwand verursacht und daher schon an dieser Stelle aus der 
weiteren Betrachtung ausgeschlossen wird . 186 



183 GAUTHIER und RIBIERE bemerken hierzu, dafi es eine Klasse von Modellen gibt, bei denen die 
Pseudokosten unabhangig von der Position im Branch-and-Bound-Baum die gleiche Grofien- 
ordnung aufweisen. Vgl. hierzu: Gauthier, J.-M., Ribiere, G.: a.a.O., hier S. 29 

184 Gauthier, J.-M., Ribiere, G.: a.a.O., hier S. 30 

183 GAUTHIER und RIBIERE sprechen in diesem Fall von der Losung eines "dummy subproblems". 
Vgl. hierzu: Gauthier, J.-M., Ribiere, G.: a.a.O., hier S. 30 

186 Bei der Berechnung von Zusatz-Pseudokosten kann der Fall auftreten, dafi sich aufgrund von 
Unzulassigkeiten die benotigten Zusatz-Pseudokosten nicht ermitteln lassen. Es entsteht dann 
eine ahnliche Situation wie bei den Pseudokosten. Im folgenden wird davon ausgegangen, dafi 
dieser Fall selten eintrifft und daher im Zusammenhang mit der Berechnung von Zusatz-Pseu- 
dokosten auf eine Uberarbeitung der geschatzten Zielfunktionswerte verzichtet werden kann. 
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4.2.5.2. Kosten der Nichterfiillung 

Die Kosten der Nichterfiillung 187 geben nicht wie die Pseudokosten fiir jeden SOS 
und fiir jeden moglichen Teilungspunkt oder Zustand des SOS die Verschlechterung 
des Zielfunktionswertes pro Einheit der Veranderung des durch den Teilungspunkt 
bzw. Zustand gegebenen Wertes des SOS an, sondern global fiir alle SOS die Veran- 
derung des Zielfunktionswertes pro Einheit der Veranderung des Grades der Unzu- 
lassigkeit. 

Der Grad der Unzulassigkeit berechnet sich hierbei als Summe der Nichterfiillung 
der einzelnen SOS: 188 

s m =X A j VmeV N (4.28) 

jeJ 

Fiir die Berechnung der Kosten der Nichterfiillung mufi der Zielfunktionswert der 
kontinuierlichen Losung dem Zielfunktionswert einer ganzzahligen bzw. gemischt- 
ganzzahligen Losung gegeniibergestellt werden und die Differenz auf die Unzulas- 
sigkeit der kontinuierlichen Losung bezogen werden. 

x = F Q - - 5l (4.29) 

s 0 

Der geschatzte Zielfunktionswert berechnet sich ahnlich wie der geschatzte Ziel- 
funktionswert auf der Basis der Pseudokosten. Die Unzulassigkeit in einem Knoten 
m wird mit den Kosten der Nichterfiillung bewertet und das Ergebnis vom aktuellen 
Zielfunktionswert abgezogen. 

E m =F m -Xs m Vm e V N (4.30) 

Da zur Berechnung der Kosten der Nichterfiillung der Zielfunktionswert einer ganz- 
zahligen Losung benotigt wird, mufi bis zum Erreichen der ersten ganzzahligen 
Losung fiir die Kosten entweder ebenfalls ein Schatzwert eingesetzt werden oder 
aber auf die Berechnung von geschatzten Zielfunktionswerten verzichtet werden. Im 
folgenden wird davon ausgegangen, dafi fiir die Hohe der Kosten der Nichterfiil- 
lung keinerlei Anhaltspunkte existieren und damit bis zum Erreichen der ersten 
ganzzahligen Losung auf geschatzte Zielfunktionswerte verzichtet wird. 



187 Dieses Kriterium wird in der Literatur als Best Projection Kriterium bezeichnet. Vgl. hierzu: 
Forrest, Hirst, J.P.H., Tomlin, J.A.: a.a.O., hier S. 748 ff 

188 Forrest, J.J.H., Hirst, J.P.H., Tomlin, J.A.: a.a.O., hier S. 750 
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Werden im Laufe der Baumabarbeitung mehrere ganzzahlige Losungen ermittelt, so 
wird stets der Zielfunktionswert der zuletzt ermittelten ganzzahligen Losung fur die 
Berechnung der Kosten der Nichterfiillung herangezogen und die zuvor schon 
ermittelten geschatzten Zielfunktionswerte iiberarbeitet. 

4.3. Ablauf des speziellen sequentiellen Branch-and-Bound-Algo- 
rithmus 

Insgesamt ergeben sich aus Abschnitt 4.2. folgende Verfahrensvarianten: 

- Relaxation 

- im Falle binarer SOS einfache Relaxation 

- im Falle kontinuierlicher SOS 

- einfache Relaxation 

- erweiterte Relaxation 

- Verzweigungsregel 

- Binarbaum mit festem Teilungspunkt 

- Binarbaum mit variablem Teilungspunkt 

- Mehrfachbaum 

- Abarbeitungsreihenfolge der SOS 

- nach sinkendem Umfang der SOS 

- auf der Basis von Modellkoeffizienten 

- im Falle eines binaren SOS auf der Basis des Nichterfiillungsgrades der binaren 
SOS-Variablen 

- im Falle kontinuierlicher SOS 

- auf der Basis des Nichterfiillungsgrades der binaren SOS 

- auf der Basis des Nichterfiillungsgrades der kontinuierlichen SOS 

- Bestimmung des Teilungspunktes 

- im Falle binarer SOS auf der Basis binarer SOS-Variablen 

- im Falle kontinuierlicher SOS 

- auf der Basis binarer SOS-Variablen 

- auf der Basis kontinuierlicher SOS-Variablen 
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Suchstrategie 

- best-first-Suche 

- kombinierte Tiefen- und best-first-Suche auf der Basis von Zielfunktionswerten 

- kombinierte Tiefen- und best-first-Suche auf der Basis von geschatzten Ziel- 
funktionswerten 

Berechnung der geschatzten Zielfunktionswerte 

- auf der Basis von Pseudokosten 

- im Falle binarer SOS Berechnung der Pseudokosten auf der Basis binarer 
SOS-Variablen 

- im Falle kontinuierlicher SOS 

- Berechnung der Pseudokosten auf der Basis binarer SOS-Variablen 

- Berechnung der Pseudokosten auf der Basis kontinuierlicher SOS-Varia- 
blen 

- auf der Basis von Zusatz-Pseudokosten 

- im Falle binarer SOS Berechnung der Pseudokosten auf der Basis binarer 
SOS-Variablen 

- im Falle kontinuierlicher SOS 

- Berechnung der Pseudokosten auf der Basis binarer SOS-Variablen 

- Berechnung der Pseudokosten auf der Basis kontinuierlicher SOS-Varia- 
blen 

- auf der Basis von Kosten der Nichterfiillung 

- im Falle binarer SOS Berechnung der Kosten der Nichterfiillung auf der 
Basis binarer SOS-Variablen 

- im Falle kontinuierlicher SOS 

- Berechnung der Kosten der Nichterfiillung auf der Basis binarer SOS- 
Variablen 

- Berechnung der Kosten der Nichterfiillung auf der Basis kontinuierlicher 
SOS-Variablen 
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- Berechnung der Pseudokosten 

- Berechnung von Pseudokosten beim ersten Auftreten eines Teilungspunktes 

oder Zustands 

- wiederholte Berechnung von Pseudokosten 

- direkte Ubernahme der Pseudokosten 

- Durchschnitt iiber alle bisher ermittelten Pseudokosten des Teilungspunktes 
oder Zustands 

Wahrend die gewahlte Relaxation und die Art der Berechnung des Teilungspunktes 
im Falle einer binaren Verzweigung den Ablauf des Algorithmus nicht beeinflussen, 
ergeben sich durch die anderen Verfahrensmoglichkeiten z.T. unterschiedliche Ab- 
laufe des Algorithmus. 

Im einzelnen weist der Algorithmus folgenden Ablauf auf: 

1. Bevor mit der eigentlichen Baumabarbeitung begonnen werden kann, miissen 

erst nacheinander die Schritte 1.1. - 1.9. ausgefuhrt werden. 

1.1. Die LP-Eingabedaten und die SOS-Eingabedaten werden eingelesen so- 
wie der aktuelle Bound 189 auf den Wert gesetzt. 

1.2. Falls als Verzweigungsregel 'Binarbaum mit variablem Teilungspunkt' 

* 

gewahlt worden ist, werden den SOS-Variablen Gewichte zugeordnet und 
anschliefiend die SOS-Variablen nach absteigender Wichtung sortiert. 

1.3. Das relaxierte Ausgangsproblem wird gelost. 

1.4. Um die Abarbeitungsreihenfolge der SOS festlegen zu konnen, werden 
den einzelnen SOS Gewichte zugeordnet und dann eine Sortierung nach 
absteigendem Gewicht vorgenommen. 

1.5. Der erste zu bearbeitende SOS wird bestimmt und damit auch gleichzeitig 
die Zahl der schon erfiillten SOS ermittelt. 

1.6. Ist die Losung bereits zulassig, d.h. sind alle SOS-Bedingungen erfiillt, 
wird sofort zu 3. gegangen. Ansonsten wird mit Schritt 1.7. fortgefahren. 

1.7. Im Falle der Verzweigungsregel 'Binarbaum' wird zusatzlich noch der 
Teilungspunkt berechnet. 



189 ]3 er aktuelle Bound entspricht jeweils dem Zielfunktionswert der bisher besten ganzzahligen 
Losung des Problems. 
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1.8. Soli auch fur die kontinuierliche Losung ein geschatzter Zielfunktionswert 
bestimmt werden, so miissen zunachst Zusatz-Pseudokosten berechnet 
werden, damit anschliefiend der geschatzte Zielfunktionswert bestimmt 
werden kann. 

1.9. Sollen die geschatzten Zielfunktionswerte auf der Basis von Kosten der 
Nichterfullung bestimmt werden, mufi die Nichterfiillung der kontinu- 
ierlichen Losung ermittelt werden. 

2. Es wird jetzt mit der Baumabarbeitung begonnen, die die Schritte 2.1. - 2.9. 

umfafit. 

2.1. Der nachste zu bearbeitende Knoten wird bestimmt. 1st kein Knoten mehr 
vorhanden, wird zu 3. gegangen. Ansonsten wird mit Schritt 2.2. fortge- 
fahren. 

2.2. Fur den gewahlten Knoten wird die Festsetzung der Variablen vorge- 
nommen. 

2.3. Die LP-Optimierung wird durchgefiihrt. 

2.4. Die zuvor festgesetzten Variablen werden wieder freigesetzt. 

2.5. Falls das Teilproblem zulassig ist (Test 1) und der Zielfunktionswert 
grofier als der aktuelle Bound ist (Test 2), wird zu Schritt 2.6. gegangen. 
Ansonsten wird der aktuelle Knoten entsprechend gekennzeichnet und 
wieder mit Schritt 2.1. begonnen. 

2.6. Der nachste zu bearbeitende SOS wird bestimmt und damit wiederum 
gleichzeitig die Anzahl bereits erfiillter SOS ermittelt. 

2.7. Im Falle der Verzweigungsregel 'Binarbaum' wird der Teilungspunkt 
bestimmt. 

2.8. Falls fur die Suchstrategie geschatzte Zielfunktionswerte herangezogen 
werden, mufi mit Schritt 2.8.1. fortgefahren werden, ansonsten mit Schritt 

2.9.. 

2.8.1. Sollen fur die Ermittlung der geschatzten Zielfunktionswerte 
Pseudokosten herangezogen werden, so sind diese in dem Fall zu 
bestimmen, wo bzgl. des aktuellen Teilungspunktes oder Zu- 
stands noch keine Pseudokosten berechnet worden sind oder die 
Pseudokosten immer neu berechnet werden sollen. 
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2.8.2. Sollen bei der Berechnung des geschatzten Zielfunktionswertes in 
dem Fall, wo benotigte Pseudokosten noch nicht berechnet wor- 
den sind, Zusatz-Pseudokosten ermittelt werden, so sind diese zu 
bestimmen. 

2.8.3. Basieren die geschatzten Zielfunktionswerte auf Kosten der 
Nichterfiillung, so sind diese zu bestimmen. 

2.8.4. Die geschatzten Zielfunktionswerte werden berechnet. 

2.8.5. Sind die folgenden Bedingungen erfiillt: 

- als Suchstrategie wurde die kombinierte Suche gewahlt, 

- der gerade behandelte Teilbaum laPt sich nicht weiter fortfiih- 
ren, 

- im Laufe der Abarbeitung des gerade behandelten Teilbaums 
sind Pseudokosten oder Kosten der Nichterfiillung neu be- 
rechnet worden, 

dann erfolgt eine Uberarbeitung der geschatzten Zielfunktions- 
werte auf der Grundlage der aktuellen Kosten. 

2.9. Sind alle SOS erfiillt, miissen die Schritte 2.9.1. und 2.9.2. ausgefiihrt wer- 
den. Ansonsten wird wieder mit dem Schritt 2.1. begonnen. 

2.9.1. Der aktuelle Knoten wird als Blattknoten gekennzeichnet. 

2.9.2. Es wird gepriift, ob der Zielfunktionswert besser ist als der Ziel- 
funktionswert des aktuellen Bound (Test 3). Ist dieses der Fall, 
wird der aktuelle Bound auf den Zielfunktionswert gesetzt und 
zu Schritt 2.9.2. 1. gegangen. Andernfalls wird zu Schritt 2.1. ge- 
gangen. 

2.9.2. 1. An alien Knoten, an denen bisher noch weiter verzweigt 
werden konnte, wird iiberpriift, ob ihr Zielfunktionswert 
besser ist als der des neuen aktuellen Bound (Test 4). Ist 
dieses der Fall, werden sie entsprechend gekennzeichnet. 

2. 9.2.2. Gibt es keinen Knoten, dessen Zielfunktionswert besser ist 
als der aktuelle Bound, wird zu 3. gegangen. Ansonsten 
wird wieder bei Schritt 2.1. begonnen. 

3. Die beste zulassige Losung wird noch einmal neu berechnet und anschliePend 
terminiert der Algorithmus. 
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Abbildung 9 a-d: Ablaufdiagramm fur den speziellen Branch-and-Bound-Algorithmus 
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4.4. Beurteilung der verschiedenen Verfahrensvarianten 

Eine fundierte Beurteilung der verschiedenen Verfahrensvarianten ist nur durch 
umfangreiche praktische Tests zu erreichen. Trotzdem lassen sich a priori eine Reihe 
von Aussagen machen, die eventuelle Vor- und Nachteile der verschiedenen 
Verfahrensvarianten aufzeigen. 

4.4.1. Relaxation 

Die erweiterte Relaxation fiihrt zwar auf der einen Seite in vielen Fallen zu einer 
erheblichen Reduzierung der Gesamtzahl der Nebenbedingungen eines Modells und 
damit in der Regel auch zu einer Verringerung des Aufwands fur die Berechnung 
jedes einzelnen Knotens. Auf der anderen Seite vergrofiert sich jedoch der Losungs- 
raum. Da im allgemeinen die Anzahl zu berechnender Knoten umso geringer ist, je 
kompakter der Ldsungsraum ist 190 , mufi bei der erweiterten Relaxation mit einem 
Anstieg der Knotenanzahl gegeniiber der einfachen Relaxation gerechnet werden. 
Welche der beiden Relaxationen, die einfache oder die erweiterte, die kiirzere 
Gesamtbearbeitungszeit liefert, ist demnach im wesentlichen davon abhangig, ob die 
Zeitersparnis, die durch die kiirzere Bearbeitungszeit der einzelnen Knoten erzielt 
werden kann, grower oder kleiner als der Mehraufwand durch eine eventuell hohere 
Anzahl zu berechnender Knoten ist. 

4.4.2. Verzweigungsregel 

Die Zahl der im schlechtesten Fall zu bearbeitenden Knoten ist bei binarer Verzwei- 
gung hoher als bei mehrfacher Verzweigung. Trotzdem kann die Zahl der tatsach- 
lich zu bearbeitenden Knoten bei der Binarverzweigung niedriger sein, und zwar 
dann, wenn im Laufe der Baumabarbeitung haufig der Fall eintritt, daiS ein SOS 
schon erfiillt ist, ohne dafi alle notwendigen SOS-Variablen fixiert werden mufiten. 
In der Abbildung 10 findet sich fiir einen SOS mit dem Umfang u* =5 ein Beispiel, 
wobei im Falle der Binarverzweigung ein variabler Teilungspunkt gewahlt worden 
ist. 



* 9 ^ Suhl, U.: Entwicklungstendenzen von mathematischer Optimierungs-Software, IBM Kongress 
'86, IBM Deutschland 1986, S. 13 f; Spielberg, K.: Entwicklungstendenzen in der Mathematischen 
Programmierung, IBM Kongress '88, IBM Deutschland 1988, S. 13 f 
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Binarbaum 




Mehrfachbaum 



• freie Variable 

O fixierte Variable 

O freie, aber erfiillte Variable 



Abbildung 10: Gegeniiberstellung Knotenanzahl Bindr- und Mehrfachbaum 

Werden im Hinblick auf die Zahl der zu bearbeitenden Knoten die Binarverzwei- 
gung mit festem und mit variablem Teilungspunkt gegeniibergestellt, ist zu vermu- 
ten, dafi bei einem festen Teilungspunkt die Knotenanzahl hoher ist, da hier in 
keiner Weise auf die momentane Variablenauspragung eingegangen wird. Ein einfa- 
ches Beispiel in der Abbildung 11 soli diese Vermutung verdeutlichen. Als fester 
Teilungspunkt wird r=2 gewahlt. 
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Abbildung 11: Gegeniiberstellung Knotenanzahl Binarbaum mit festem und mit variablem 

Teilungspunkt 
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Fur die durchschnittliche Knotenbearbeitungszeit ist zu erwarten, dafi sie im Falle 
der Mehrfachverzweigung geringer als im Falle der Binarverzweigung ist. Diese 
Vermutung basiert auf zwei Tatsachen. Zum einen unterscheiden sich die beiden im 
Falle der Binarverzweigung nacheinander auf einer Stufe bearbeiteten Teilprobleme 
starker als die jeweils auf einer Stufe nacheinander bearbeiteten Teilprobleme im 
Falle der Mehrfachverzweigung, so dafi bei der Mehrfachverzweigung das Wieder- 
aufsetzen effizienter ist. Zum anderen ist bei der Mehrfachverzweigung die Zahl der 
fixierten Variablen in einem Knoten im Durchschnitt hoher als bei der Binarver- 
zweigung. Da durch die Fixierung von Variablen der Losungsraum des jeweils 
betrachteten Problems verkleinert wird, ist davon auszugehen, dafi sich der Zeitauf- 
wand fur die Losung des Problems ebenfalls verringert. 

Im Zusammenhang mit der Schatzung von Zielfunktionswerten fallt gegebenenfalls 
noch die Zeit fur die Uberarbeitung der geschatzten Zielfunktionswerte an. Werden 
diese auf der Grundlage von Pseudokosten berechnet, so mufi die Uberarbeitung 
immer dann erfolgen, wenn in einem Ast ein oder mehrere Pseudokosten neu 
berechnet worden sind. Werden fur einen Teilungspunkt oder Zustand nur beim 
ersten Auftreten Pseudokosten berechnet, so sind bei der Mehrfachverzweigung im 
Gegensatz zur Binarverzweigung im allgemeinen schon nach der Bearbeitung des 
ersten Astes fast alle benotigten Pseudokosten ermittelt worden. Eine Uberarbeitung 
der geschatzten Zielfunktionswerte mufi daher in der Regel nur wenige Male erfol- 
gen, wahrend sie bei der Binarverzweigung u.U. sehr haufig durchzufuhren ist. 

Bei der kombinierten Suche mit Zusatz-Pseudokosten miissen im Falle der Mehr- 
fachverzweigung die meisten Zusatz-Pseudokosten im Gegensatz zur Binarverzwei- 
gung schon fur die Schatzung des Zielfunktionswertes der kontinuierlichen Losung 
ermittelt werden, so dafi sich an dieser Stelle ein erheblich hoherer Zeitbedarf fur die 
Mehrfachverzweigung als fur die Binarverzweigung ergibt. Dafiir ist bei der Binar- 
verzweigung der Zeitaufwand fur die Berechnung der Zusatz-Pseudokosten in den 
anderen Knoten hoher. 

4.4.3. Suchstrategie 

Die Artzahl der zu bearbeitenden Knoten ist, wie oben schon erwahnt, bei der best- 
first-Suche geringer oder hochstens so hoch wie bei der kombinierten Tiefen- und 
best-first-Suche, da durch die Tiefensuche nicht mehr gewahrleistet ist, dafi keine 
uberfltissigen Knoten berechnet werden miissen. 
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Auf der anderen Seite liegt die Vermutung nahe, dal? die Zeit fur die Bearbeitung 
eines Knotens bei der kombinierten Suche geringer als bei der best-first-Suche ist, da 
hier die Wiederaufsetzmoglichkeit in der Regel nicht nur fur alle unmittelbaren 
Nachfolger eines Knotens, sondern auch ftir die nachfolgenden Stufen eine Zeiter- 
sparnis bringt. Dieses sollte insbesondere bei der Binarverzweigung zu einem Zeit- 
vorteil gegeniiber der best-first-Suc±ie fiihren, da sich hier durch das Wiederaufset- 
zen innerhalb einer Stufe ein nicht so grower Zeitgewinn erzielen lafit, wohl aber 
durch das Wiederaufsetzen auf einer nachfolgenden Stufe. 

Welche der beiden Strategien die kiirzere Gesamtbearbeitungszeit liefert, wird dem- 
nach da durch bestimmt, ob bei der kombinierten Suche die Zeitersparnis durch die 
geringere durchschnittliche Knotenbearbeitungszeit kleiner oder grower als der 
Mehraufwand durch die hohere Knotenanzahl ist. 

4.4.4. Beriicksichtigung von geschatzten Zielfunktionswerten bei der kombi- 
nierten Suche 

Bei der kombinierten Suche auf der Basis von geschatzten Zielfunktionswerten miis- 
sen gegeniiber der kombinierten Suche auf der Basis von Zielfunktionswerten 
sowohl die fur die Berechnung der geschatzten Zielfunktionswerte benotigten Pseu- 
dokosten, Zusatz-Pseudokosten oder Kosten der Nichterfiillung bestimmt werden 
als auch die geschatzten Zielfunktionswerte selbst ermittelt und eventuell noch 
iiberarbeitet werden. 

Der dadurch entstehende betrachtliche Mehraufwand wird unter der Vermutung in 
Kauf genommen, dal? durch die Vorhersage der Zielfunktionswerte weniger Knoten 
als bei der kombinierten Suche auf der Basis von Zielfunktionswerten berechnet 
werden miissen und dadurch eine Zeitersparnis erzielt werden kann, die hoher als 
der Mehraufwand ist. Inwieweit dieses in der Praxis der Fall ist, lal?t sich jedoch 
nicht vorhersagen. 

4.4.5. Berechnungsarten der geschatzten Zielfunktionswerte 

Bei der Berechnung von Zusatz-Pseudokosten mul? fur die fehlenden Pseudokosten 
noch zusatzlich ein lineares Optimierungsproblem gelost werden, so dal? sich hier 
gegeniiber der ausschliel?lichen Ermittlung von Pseudokosten und der Ermittlung 
von Kosten der Nichterfiillung ein erheblicher Mehraufwand ergibt. Auf der ande- 
ren Seite entfallt jedoch die Uberarbeitung der geschatzten Zielfunktionswerte. 

Im Falle der ausschliel?lichen Berechnung von Pseudokosten fiihrt die einmalige 
Berechnung der Pseudokosten zu einem geringeren Zeitaufwand als die wiederholte 
Berechnung der Pseudokosten, da bei der wiederholten Berechnung zum einen die 
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eigentliche Ermittlung der Pseudokosten einen erhohten Zeitaufwand verursacht 
und zum anderen haufiger eine Uberarbeitung der geschatzten Zielfunktionswerte 
anfallt. Dafiir soil die wiederholte Berechnung durch die Berucksichtigung des Fort- 
schritts in der Baumabarbeitung eine bessere Schatzung liefern und damit zu einer 
geringeren Knotenanzahl fiihren. 

Werden den geschatzten Zielfunktionswerten statt Pseudokosten die Kosten der 
Nichterfiillung zugrunde gelegt, so miissen sie nur berechnet werden, wenn ein 
neuer Bound gefunden worden ist. Da dieses im Laufe des Optimierungsprozesses 
im allgemeinen relativ selten vorkommt, ist der hierfiir erforderliche Zeitaufwand 
geringer als der Zeitaufwand fur die Berechnung der Pseudokosten. Beziiglich der 
Uberarbeitung der geschatzten Zielfunktionswerte lafit sich keine Abschatzung 
vornehmen, da im Falle der Berucksichtigung von Pseudokosten der Zeitbedarf 
davon abhangt, wie lange es dauert, bis alle benotigten Pseudokosten berechnet 
worden sind. 

Insgesamt lafit sich nur vermuten, dafi der zeitliche Mehraufwand fiir die Berech- 
nung der geschatzten Zielfunktionswerte am geringsten ist, wenn Kosten der 
Nichterfiillung berechnet werden, und am hochsten, wenn Zusatz-Pseudokosten 
ermittelt werden. 

Im Hinblick auf die Anzahl zu bearbeitender Knoten lassen sich keine Vorhersagen 
treffen. Grundsatzlich soil jedoch ein erhohter Aufwand fiir die Berechnung der 
geschatzten Zielfunktionswerte zu einer derart geringen Knotenanzahl fiihren, dafi 
die dadurch verursachte Zeitersparnis hoher als der damit verbundene 
Mehraufwand ist. 




5. Parallelisierung von Branch-and-Bound-Algorithmen 

Fur die Parallelisierung von Branch-and-Bound-Algorithmen finden sich in der Lite- 
ratur eine Vielzahl von Vorschlagen. Die einzelnen Parallelisierungsvarianten unter- 
scheiden sich hierbei im wesentlichen durch den gewahlten Grad der Granulierung, 
die Verteilung der Kontrolle und die Verteilung der Daten. Im folgenden werden 
daher zunachst hinsichtlich dieser drei Kriterien mogliche Auspragungen vorge- 
stellt, bevor die im Rahmen der vorliegenden Arbeit konkret betrachteten Paralleli- 
sierungsvarianten vorgestellt werden. 

Neben der Beschreibung von Parallelisierungsvarianten haben viele Autoren auch 
versucht, eine Abschatzung des maximal moglichen Speedups vorzunehmen. In 
diesem Zusammenhang haben die bei parallelen Branch-and-Bound-Algorithmen 
auftretenden Anomalien eine besondere Bedeutung erlangt. Sie werden deshalb 
kurz erlautert, bevor fiir die hier betrachteten Parallelisierungsvarianten 
Analysemodelle vorgestellt werden, die ebenfalls eine Abschatzung des maximal 
moglichen Speedups ermoglichen sollen. 

5.1. Bestimmende Faktoren der Parallelisierung 

5.1.1. Grad der Granulierung 

Der Grad der Granulierung wird durch die Anzahl der Anweisungen, die unab- 
hangig voneinander parallel von mehreren Prozessen ausgefiihrt werden, bestimmt. 
1st diese Anzahl gering, liegt eine feine (small-scale) Granulierung vor. Wird dage- 
gen eine grofie Anzahl von Anweisungen unabhangig voneinander parallel ausge- 
fiihrt, handelt es sich um eine grobe (large-scale) Granulierung. 191 

Der zu realisierende Grad der Granulierung wird ganz wesentlich von den Daten- 
abhangigkeiten beeinflufit. Solange ein Prozefi keine Daten von anderen Prozessen 
benotigt, kann er unabhangig von den anderen Prozessen seine Anweisungen aus- 
fiihren. Gelangt ein Prozefi dagegen an eine Anweisung, bei der er Daten von einem 
anderen Prozefi benotigt, mufi er warten, bis der andere ProzeiS die Daten zur Ver- 
fiigung stellt 192 . Handelt es sich hierbei nur um eine Aktualisierung von bereits 



191 Hockney, R.W., Jesshope, C.R.: Parallel computers 2, architecture, programming and algorithms, 
2. Aufl., Bristol Philadelphia 1988, S. 103 

192 Die Beschreibung der verschiedenen Parallelisierungsvarianten erfolgt unabhangig von der 
Hardware. Es wird deshalb im folgenden statt des Begriffs 'verschicken' grundsatzlich der 
hardware-neutralere Begriff 'zur Verfugung stellen' verwendet, da bei einem stark gekoppelten 
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vorhandenen Daten, so kann der Prozefi in vielen Fallen auch weiterarbeiten, ohne 
den neuesten Stand der Daten zu kennen. Es entsteht dann jedoch ein Verlust an 
Information, der sich negativ auf das Losungsverhalten des Algorithmic auswirken 
kann. 

Grundsatzlich ist der Grad der Granulierung so zu wahlen, dafi einerseits moglichst 
viele Anweisungen unabhangig voneinander parallel ausgefiihrt werden und damit 
der Parallelisierungsgrad hoch ist und andererseits ein geringer Informationsverlust 
eintritt. 

5.1.2. Verteilung der Kontrolle 

Die Kontrolle kann entweder zentral oder dezentral erfolgen. Eine zentrale Kontrolle 
wird durch das Master-Slave-Prinzip 193 realisiert, bei dem ein Kontrollprozefi, der 
sogenannte Master, die Kontrolle iiber alle anderen Prozesse, die sogenannten 
Slaves, besitzt. Der Master verteilt die Aufgaben an die Slaves. Er weifi damit genau, 
welche Aufgabe welcher Slave ausfiihrt. Die Slaves untereinander wissen nicht, wel- 
che Aufgaben jeweils die anderen Slaves bearbeiten. Informationen von einem ande- 
ren Slave konnen sie nur fiber den Master erhalten. 

Eine dezentrale oder auch verteilte Kontrolle ist die Grundlage fur das Prinzip der 
kooperativen Autonomie . 194 Hier arbeiten alle Prozesse gleichberechtigt an der 
Losung des Gesamtproblems. Jeder Prozefi sucht sich seine Aufgaben selbstandig. Ist 
eine gegenseitige Absprache erforderlich, um zu vermeiden, dafi die gleiche 
Aufgabe von mehreren Prozessen bearbeitet wird, teilt entweder jeder Prozefi den 
anderen Prozessen die Ubemahme einer Aufgabe mit oder aber jeder Prozefi fragt 
die anderen Prozesse vor der Ubemahme einer Aufgabe, ob diese schon bearbeitet 
worden ist oder nicht. 

5.1.3. Verteilung der Daten 

Die Daten konnen entweder jedem Prozefi direkt zugeordnet werden, so dafi auch 
nur dieser Prozefi direkt auf sie zugreifen kann, oder aber sie konnen derart gehalten 
werden, dafi alle Prozesse gleichberechtigt darauf zugreifen konnen. In diesem Fall 
sind die Daten keinem Prozefi direkt zugeordnet. 



Multiprozessorsystem keine Nachrichten verschickt werden, sondem der Datenaustausch iiber 
einen gemeinsamen Speicher erfolgt. 

1 93 Giloi, W.K.: Rechnerarchitektur, Berlin Heidelberg 1981, S. 311 und 313 

194 Giloi, W.K.: a.a.O., S. 311 
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Werden bei jedem Prozefi Daten gespeichert, so sind zwei Varianten moglich. Ent- 
weder kann eine Kopie aller Daten bei jedem Prozefi gehalten werden oder aber je- 
der Prozefi halt nur einen Teil der gesamten Daten. 

Im ersten Fall entsteht das Problem, dafi bei einer Anderung der Daten durch einen 
Prozefi, diese bei den anderen Prozessen ebenfalls aktualisiert werden miissen. Im 
zweiten Fall mufi ein Prozefi ggf. von den anderen Prozessen Daten anfordern. In 
beiden Fallen mufi eine Absprache beziiglich der zu bearbeitenden Teilprobleme 
erfolgen, damit jedes Teilproblem auch nur jeweils von einem Prozefi bearbeitet 
wird. 

Bei einem gemeinsamen Zugriff kann das Problem auftreten, dafi mehrere Prozesse 
gleichzeitig auf Daten zugreifen wollen. In dem Fall, wo hierdurch die Gefahr be- 
steht, dafi ein Teilproblem von mehreren Prozessen bearbeitet wird, ist ein gleich- 
zeitiger Zugriff auszuschliefien. 

Die zu wahlende Speicherungsform wird durch verschiedene Faktoren bestimmt. 
Zum einen beeinflufit der gewahlte Grad der Granulierung und die Art der Kon- 
trolle die Speicherungsform, da hierdurch festgelegt wird, welche Daten von 
welchem Prozefi benotigt werden. Zum anderen sind aber auch die Fragen, ob die 
Daten im Laufe der Bearbeitung verandert werden oder nicht, wie haufig die Daten 
gegebenenfalls verandert werden und von wie vielen der insgesamt an der Bearbei- 
tung beteiligten Prozessen die Daten verandert werden, fur die Auswahl der 
Speicherungsform von Bedeutung. 

Grundsatzlich sollte die Speicherungsform so gewahlt werden, dafi jeweils die 
Daten, die von einem Prozefi benotigt werden, ihm auch ohne grofien Auf wand zur 
Verfiigung stehen. 

5.2. Moglichkeiten der Parallelisierung von Branch-and-Bound-Algo- 
rithmen 

5.2.1. Uberblick 

Im Falle eines Branch-and-Bound-Algorithmus bedeutet eine feine Granulierung, 
dafi Teile der Bearbeitung innerhalb eines Knotens, also die Losung eines kontinu- 
ierlichen Optimierungsproblems, parallel ausgefiihrt werden . 195 Ein hoher Paralle- 



195 Fiir die parallele Losung eines kontinuierlichen Optimierungsproblems, allerdings nicht im Zu- 
sammenhang mit einem Branch-and-Bound-Algorithmus, finden sich neben zahlreichen Imple- 
mentationen auf Vektor-Supercomputem auch parallele Implementationen auf massiv parallelen 
und vemetzten Systemen. Einen Uberblick iiber die Implementationen auf Vektor-Supercompu- 
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lisierungsgrad kann demnach nur erzielt werden, wenn die Bearbeitung innerhalb 
des Knotens gut parallelisierbar ist. Da es sich hierbei zumeist um impliziten Paral- 
lelismus handelt, kann er mit Hilfe eines vektoriellen oder eines Parallelcompilers 
erkannt werden. 

Eine grobe Granulierung wird erreicht, wenn auf Knotenebene parallelisiert wird, 
d.h. die Berechnung der Teilprobleme und eventuell auch die Auswahl der Teilpro- 
bleme und das Durchfuhren der Tests parallel ausgefiihrt werden. Da zumindestens 
nach einer Anfangsphase eine Vielzahl von Teilproblemen voneinander unabhangig 
sind, also ein hohes Mafi an explizitem Parallelismus vorliegt, verspricht eine grobe 
Granulierung einen relativ hohen Parallelisierungsgrad, wohingegen dieses bei einer 
feinen Granulierung nicht unbedingt gegeben scheint. Im folgenden wird daher fur 
die Parallelisierung nur eine grobe Granulierung betrachtet . 196 

Eine grobe Granulierung des betrachteten Branch-and-Bound-Algorithmus laPt 
sowohl eine auf dem Master-Slave-Prinzip als auch eine auf dem Prinzip der 
kooperativen Autonomie basierende Parallelisierung zu. 

Das Master-Slave-Prinzip fiihrt zu folgender Arbeitsteilung: Der Master wahlt fiir 
die Slaves die Teilprobleme aus, die diese dann bearbeiten. AnschliePend wertet der 
Master die Ergebnisse aus. Der Grad der Granulierung laPt sich hierbei noch in 
Abhangigkeit vom Umfang der durch die Slaves zu bearbeitenden Teilprobleme 
variieren. Der geringste Grad der Granulierung wird erreicht, wenn der Master den 
Slaves nur jeweils einen Knoten zur Bearbeitung zuteilt . 197 Um einen hoheren Grad 



tern gibt BEASLEY. Vgl. hierzu: Beasley, J.E.: Linear Programming on Cray Supercomputers, 
Journal of the Operational Research Society, Vol. 41, Nr. 2, 1990, S. 133-139; fiir die Implementa- 
tionen auf massiv parallelen und vemetzten Systemen vgl.: Ho, H.F., Chen, G.H., Lin, S.H., 
Sheu, J.P.: Solving Linear Programming on Fixed-size Hypercubes, in: Bailey, D.H. (Hrsg.), 
Proceedings of the 1988 International Conference on Parallel Processing, Vol. Ill, Algorithms and 
Applications, August 1988, Pennsylvania State University 1988, S. 112-116; Stunkel, C.B.: Linear 
Optimization Via Message-Based Parallel Processing, in: Bailey, D.H. (Hrsg.), Proceedings of the 
1988 International Conference on Parallel Processing, Vol. Ill, Algorithms and Applications, Au- 
gust 1988, Pennsylvania State University 1988, S. 264-271; Luo, J., Hulsbosch, A.N.M., Reijns, 
G.L.: An MIMD Work-station for Large LP Problems, in: Chiricozzi, E., D'Amico, A. (Hrsg.), 
Parallel Processing and Applications, Amsterdam New York 1988, S. 159-169 

* 9 ^ Zu der gleichen Erkenntnis kommen auch ASHFORD, CONNARD und DANIEL. Vgl. hierzu: 
Ashford, R., Connard, P., Daniel, R.: Experiments on Solving Mixed Integer Programming Pro- 
blems on a Small Array of Transputers, wird erscheinen in: Journal of the Operational Research 
Society 

I 97 Diesen Ansatz haben z.B. BOXMA und KINDERVATER gewahlt. Vgl. hierzu: Boxma, O.J., 
Kindervater, G.A.P.: A Queueing Network Model for Analyzing a Class of Branch and Bound 
Algorithms on a Master-Slave Architecture, Report, Centre for Mathematics and Computer 
Science, Amsterdam, Oktober 1987 
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zu erzielen, konnen aber auch mehrere Knoten bis hin zu maximal einem ganzen 
Teilbaum unabhangig vom Master auf den Slaves bearbeitet werden . 198 

Wird das Prinzip der kooperativen Autonomie verwirklicht, wahlen sich die Prozes- 
se unter Absprache mit den anderen Prozessen selbst die Teilprobleme aus, berech- 
nen sie und werten die Ergebnisse aus. 

Fiir die Verteilung der Daten ist zu beachten, dafi bei einem Branch-and-Bound- 
Algorithmus zum einen die fiir die Losung der Teilprobleme benotigten Daten und 
zum anderen die fiir die Baumabarbeitung benotigten Daten gespeichert werden 
miissen. Letztere werden in Form einer Knotentabelle gehalten. 

Fiir die zur Losung der Teilprobleme benotigten Daten bietet sich unabhangig von 
der Art der Kontrolle die Speicherung einer Kopie bei jedem an der Bearbeitung der 
Teilprobleme beteiligten Prozefi an. 

Die Art der Speicherung fiir die Knotentabelle dagegen hangt von der gewahlten Art 
der Kontrolle ab. Bei zentraler Kontrolle bietet es sich an, die Knotentabelle lokal 
beim Master zu halten. Die zur Charakterisierung der Teilprobleme notwendigen 
Daten miissen dann den Slaves und die Ergebnisse der Bearbeitung dem Master zur 
Verfiigung gestellt werden. Wird eine verteilte Kontrolle angestrebt, so erscheint 
lediglich eine Speicherungsform sinnvoll, bei der alle Prozesse gleichberechtigt auf 
die Knotentabelle zugreifen konnen . 199 Ist eine derartige Speicherung aufgrund von 



198 LAVALLEE und ROUCAIROL stellen einen Ansatz vor, bei dem die Slaves nacheinander alle 
Nachfolger des jeweiligen Knotens bestimmen und berechnen sowie das Ergebnis der Berech- 
nung an den Master-Prozefi zuriickschicken und anschliefiend auf einen neuen Knoten vom 
Master-Prozefi warten. Vgl. hierzu: Lavallee, I., Roucairol, C.: A parallel branch and bound 
algorithm for asynchronous MIMD machines and computer networks. Rapport interne CNRS 
GR22, Paris VI, April 1983 

Bei einer Implementation von LULING und MONIEN behalt ein Slave-Prozefi einen Knoten so- 
fort zur weiteren Bearbeitung, wenn sich dessen Wert gegeniiber dem Vorganger knoten nicht 
verschlechtert hat. Vgl. hierzu: Liiling, R., Monien, B.: Two Strategies for solving the Vertex 
Cover Problem on a Transputer Network, in: Bermond, J.-C., Raynal, M. (Hrsg.), Distributed 
Algorithms, 3rd International Workshop, Nice, France, September 1989, Proceedings, Berlin 
Heidelberg 1989, S. 160-170 

SCHWAN, GAWKOWSKI und BLAKE stellen neben einem Master-Slave- Ansatz noch einen 
zweiten Ansatz vor, bei dem ein Master die Teilprobleme zunachst an Submaster verschickt, die 
dann eine weitere Zerlegung vomehmen und die daraus entstehenden Teilprobleme an die 
Slaves zur Bearbeitung verteilen. Insgesamt entsteht dadurch im Gegensatz zur bisherigen 2- 
stufigen Hierarchie eine 3-stufige Hierarchie. Vgl. hierzu: Schwan, K., Gawkowski, J., Blake, B.: 
Process and Workload Migration for a Parallel Branch-and-Bound Algorithm on a Hypercube 
Multicomputer, ACM, 1988, S. 1520-1530 

199 Derartige Implementationen werden z.B. beschrieben in: Huang, S.-R., Davis, L.S.: A Tight 
Upper Bound for the Speedup of Parallel Best-first Branch-and-Bound Algorithms, Technical 
Report, Center for Automation Research, University of Maryland, Mai 1987; Roucairol, C.: A 
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Hardwarebeschrankungen nicht moglich, kann zwar auch analog zur Verteilung der 
Kontrolle eine Verteilung der Knotentabelle vorgenommen werden. Da der aus einer 
derartigen Verteilung der Knotentabelle resultierende Bearbeitungsaufwand sehr 
unterschiedlich sein kann, mull im Laufe der Bearbeitung in der Regel noch eine 
Umverteilung der zu bearbeitenden Teilprobleme (Lastenausgleich) vorgenommen 
werden. 200 

Die Variante, eine Kopie der Knotentabelle bei jedem Prozefi zu halten, kann von 
vomherein verworfen werden, da der Aktualisierungsaufwand extrem hoch ist. 

In der Tabelle 7 findet sich ein Literaturiiberblick liber bereits bestehende Implemen- 
tationen. 201 



Parallel Branch and Bound Algorithm for the Quadratic Assignment Problem, Discrete Applied 
Mathematics, Vol. 18, 1987, S. 211-225; Boehning, R.L., Butler, R.M., Gillett, B.E.: A parallel inte- 
ger linear programming algorithm, EJOR, Vol. 34, 1988, S. 393-398 

200 VORNBERGER hat hierzu verschiedene Varianten implementiert. Bei einer Implementation auf 
einem PC-LAN mit Ringtopologie wendet sich ein Prozefi erst dann an seinen linken Nachbar- 
prozefi, wenn er in seiner eigenen lokalen Knotentabelle keinen Prozefi zur Bearbeitung mehr 
findet. Bei der Implementation auf einem Transputernetzwerk dagegen werden die Grofien der 
lokalen Knotentabellen zwischen den unmittelbaren Nachbarprozessen standig verglichen, um 
dann bei Erreichen einer vorgegebenen GroEendifferenz sofort einen Austausch von Knoten 
vorzunehmen. Da die Knoten in der lokalen Knotentabelle nicht alle die gleiche Prioritat haben, 
werden sie bei einer anderen Implementation auf einem Transputernetz mit Gewichten verse- 
hen. Es wird dort nicht die Anzahl der Knoten verglichen, sondern ihr Gewicht. Unterscheidet 
sich hier das Gewicht der unmittelbaren Nachbarn um eine vorgegebene Grofie, werden 
ebenfalls Knoten ausgetauscht. Vgl. hierzu: Vornberger, O.: Implementing Branch-and-Bound in 
a Ring of Processors, in: Handler, W., Haupt, D., Jeltsch, R., Jiiling, W., Lange, O. (Hrsg.), 
CONPAR 86, Conference on Algorithms and Hardware for Parallel Processing, Aachen, 
September 1986, Proceedings, Berlin Heidelberg 1986, S. 157-164; Kroger, B., Vornberger, O.: 
Parallele Losung eines Verschnittproblems, in: Grebe, R. (Hrsg.), Parallele Datenverarbeitung 
mit dem Transputer, 1. Transputer- Anwender-Treffen, TAT '89, Aachen, September 1989, 
Proceedings, Berlin Heidelberg 1990, S. 54-67 

TROY A und ORTEGA berichten von zwei Implementationen, bei denen ohne Abfrage auf die 
Grofie oder das Gewicht der lokalen Knotentabellen der unmittelbaren Nachbarprozesse immer 
alle noch zu berechnenden Nachfolger an zufallig ausgewahlte oder im vorhinein festgelegte 
Prozesse geschickt werden. Vgl. hierzu: Troya, J.M., Ortega, M.: A study of parallel branch-and- 
bound algorithms with best-first search. Parallel Computing, Vol. 11, 1989, S. 121-126 

QUINN schlagt in diesem Zusammenhang vor, einen Teil der noch zu berechnenden Nachfolger 
des durch eine vorgegebene Suchstrategie bestimmten Knotens zu einem benachbarten Prozes- 
sor zu schicken. Vgl. hierzu: Quinn, M.J.: Analysis and Implementation of Branch-and-Bound 
Algorithms on a Hypercube Multicomputer, IEEE Transactions on Computers, Vol. 39, Nr. 3, 
Marz 1990, S. 384-387 

2 °1 Ein - allerdings nicht so umfangreicher - Uberblick findet sich auch in: Roucairol, C.: Parallel 
Branch and Bound Algorithms - an overview. Report, Institut National de Recherche en Infor- 
matique et en Automatique, Le Chesnay Cedex France, Januar 1989; Pardalos, P., Li, X.: Parallel 
branch-and-bound algorithms for combinatorial optimization. Supercomputer, Vol. 7, Nr. 5, 
September 1990, S. 23-30 
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Autor 
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Parallelisierung 


Lavallee, 

Roucairol202 


allgemein 


MIMD schwach gekoppelt, 
Netzwerke 


Tiefen-, 

Breiten-, 

kombinierte 

Suche 


Master-Slave 


Vornberger, 

Monien203 


TSP 


PC-LAN, 16 Pr. 


best-first- 

Suche 


lokale Knotentabellen, 
Austausch von Teil- 
problemen 


Huang, Davis204 


TSP 


MIMD stark gekoppelt: 
BBN Butterfly 


best-first- 

Suche 


globale Knotentabelle 


Schwan, 

Gawkowski, 

Blake 2 05 


TSP 


MIMD schwach gekoppelt: 
Intel iPSC, 32 Pr. 


best-first- 
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1. Master-Slave; 
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Janakiram, Geh- 
ringer, Agrawal, 
Mehrotra206 
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globale Knotentabelle 


Altmann, 
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Breitkreutz207 
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Boehning, Butler, 
Gillett 208 
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MIMD stark gekoppelt: 
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best-first- 

Suche 
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202 Lavallee, I., Roucairol, C: a.a.O. 

203 Monien, B., Vornberger, O.: Parallel Processing of Combinatorial Search Trees, in: Parallel Algo- 
rithms and Architectures, International Workshop, Suhl, GDR, Mai 1987, Proceedings, Berlin 
1987, S. 60-69 

204 Huang, S.-R., Davis, L.S.: a.a.O. 

205 Schwan, K., Gawkowski, J., Blake, B.: a.a.O. 

206 Janakiram, V.K., Gehringer, E.F., Agrawal, D.P., Mehrotra, R.: A Randomized Parallel Branch- 
and-Bound Algorithm, International Journal of Parallel Programming, Vol. 17, Nr. 3, 1988, S. 
277-301 

202 Altmann, E., Marsland, T.A., Breitkreutz, T.: Accounting for Parallel Tree Search Overheads, in: 
Baily, D.H. (Hrsg.), Proceedings of the 1988 International Conference on Parallel Processing, Vol. 
Ill, Algorithms and Applications, August 1988, Pennsylvania State University 1988, S. 198-201 

208 Boehning, R.L., Butler, R.M., Gillett, B.E.: a.a.O. 
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Roucairol209 


QAP 


MIMD stark gekoppelt: 
CRAY X-MP, 4 Pr. 


best-first-, 
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Troya, Ortega210 
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best-first 
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1. Master-Slave; 
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Mraz212 
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Problem 


MIMD schwach gekoppelt: 
Intel iPSC 


best-first- 

Suche 


Master-Slave 


Kroger, 
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Transputer-Netzwerk 


best-first- 
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Rau-Chaplin214 
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NCUBE/7, 64 Pr. 


best-first- 

Suche 


1. Master-Slave; 
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209 Roucairol, C: Parallel Branch and Bound Algorithms - an overview, a.a.O. 

210 Troya, J.M., Ortega, M.: a.a.O. 

211 Liiling, R., Monien, B.: a.a.O. 

212 Mraz, R.T.: Performance Analysis of Parallel Branch and Bound Search with the Hypercube 
Architecture, Technical Report, Johnson Space Center, Texas, 1988 

21^ Kroger, B., Vomberger, O.: a.a.O. 

214 Dehne, F., Ferreira, A.G., Rau-Chaplin, A.: Parallel branch and bound on fine-grained hypercube 
multiprocessors. Parallel Computing, Vol. 15, 1990, S. 201-209 

213 Quinn, M.J.: Analysis and Implementation of Branch-and -Bound Algorithms on a Hypercube 
Multicomputer, a.a.O. 
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Autor 


Problem- 

stellung 


Hardware 


Suchstrategie 


Parallelisierung 


Taudes, 

Netousek^l^ 


Vertex- 

Cover- 

Problem 


Workstation-L AN: 
HP9000/330, 8 Pr. 


best-first- 

Suche 


1. Master-Slave; 

2. lokale Knotentab., 
Austausch von Teil- 
problemen 


Ashford, Connard, 
Daniel217 


MIP 


T ransputer-N etz werk 


in erster Linie 
Tiefensuche 


Master-Slave 



Tabelle 7: Literaturiiberblick parallele Branch-and-Bound-lmplementationen 



5.2.2. Parallelisierungsvarianten 

Die Wahl der Parallelisierungsvariante muB immer in Verbindung mit der Wahl der 
Hardware erfolgen. Damit kommt fur eine Implementation auf einem vemetzten 
oder einem massiv parallelen System aufgrund des fehlenden gemeinsamen Spei- 
chers nur ein Master-Slave-Ansatz, bei dem die Knotentabelle beim Master gehalten 
wird, oder aber ein verteilter Ansatz, bei dem die einzelnen Prozesse sich gegensei- 
tig abstimmen miissen, in Frage. 

Da im Falle eines verteilten Ansatzes bei einer Vielzahl von Prozessen der Abspra- 
cheaufwand sehr groB werden kann, werden im folgenden lediglich verschiedene 
Parallelisierungsvarianten vorgestellt, die auf einem Master-Slave-Ansatz beruhen. 

5.2.2.I. Parallelisierungsvariante I 

Bei der Parallelisierungsvariante I liegt die gesamte Kontrolle der Baumabarbeitung 
beim Master. Er sucht ein noch zu bearbeitendes Teilproblem aus, bestimmt einen 
Slave, der auf ein Teilproblem wartet, und stellt diesem dann die Knoteninformation 
zur Verfiigung. Der Slave berechnet daraufhin das Teilproblem und stellt anschlie- 
Bend dem Master das Ergebnis der Bearbeitung zur Verfiigung, damit dieser ent- 
sprechend die Knotentabelle iiberarbeiten kann. Fiir die Suche des nachsten zu bear- 
beitenden Teilproblems und die Uberarbeitung der Knotentabelle ist demnach aus- 



216 TAUDES und NETOUSEK haben die Ideen von LULING und MONIEN auf einem Workstation- 
Cluster nachimplementiert. Vgl. hierzu: Taudes, A., Netousek, T.: Implementing Branch-and- 
Bound Algorithms on a Cluster of Workstations - A Survey, some new Results and open Pro- 
blems, in: Grauer, M., Prefimar, D.B.: Parallel Computing and Mathematical Optimization, 
Siegen, 1990, Proceedings, Berlin Heidelberg 1991, S. 79-102 

217 Ashford, R., Connard, P., Daniel, R.: a.a.O. 
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schliefilich der Master zustandig. Es wird deshalb nur eine Knotentabelle beim 
Master gehalten. Diese enthalt samtliche Informationen zur Baumabarbeitung. 

Die Parallelisierungsvariante I realisiert ein Maximum an zentraler Kontrolle. Auf 
der anderen Seite ist der Grad der Granulierung relativ gering, da nur jeweils ein 
Knoten unabhangig voneinander bearbeitet wird. 

Wie die Abbildung 12 zeigt, ist im Hinblick auf die Suche des nachsten zu bearbei- 
tenden Knotens noch folgendes zu beachten: Der Master bestimmt nur dann einen 
neuen Knoten zur Bearbeitung, wenn zuvor ein Slave einen Knoten bekommen hat. 
Das hat den Nachteil, dafi in dem Fall, wo der Master einen neuen Bound erhalt, 
u.U. ein Knoten einem Slave zur Verfiigung gestellt wird, der gar nicht mehr bear- 
beitet werden mufi. Auf der anderen Seite entsteht jedoch ein Zeitvorteil, wenn der 
Master schon einen Knoten hat bestimmen konnen, bevor ein Slave einen Knoten 
anfordert. Der Slave braucht in diesem Fall nicht mehr auf die Bestimmung eines 
Knotens zu warten. Da davon ausgegangen wird, dafi der Zeitvorteil hoher ist als 
der eventuell entstehende vermeidbare Zeitaufwand, wird die soeben beschriebene 
Vorgehensweise realisiert. 

5.2.2.2. Parallelisierungsvariante II 

Bei der Parallelisierungsvariante II erfolgt eine grobere Granulierung. Hierzu wird 
ein Teil der Kontrolle vom Master auf die Slaves iibertragen. Der Master bestimmt 
nicht mehr direkt den Knoten, der von einem Slave bearbeitet werden soil, sondern 
einen Knoten, dessen unmittelbare Nachfolger noch bearbeitet werden miissen. 
Anschliefiend wahlt er auch hier einen Slave aus und stellt ihm die erforderliche 
Knoteninformation zur Verfiigung. 

Die Bestimmung der unmittelbaren Nachfolger wird nun von dem Slave selber vor- 
genommen. Er bestimmt und berechnet jetzt solange einen Nachfolger und wertet 
jeweils das Ergebnis aus, bis alle Nachfolger bearbeitet worden sind. Da der Master 
den Slaves keine Bound-Information zur Verfiigung stellt, wird nur eine Auswer- 
tung im Hinblick auf die Zulassigkeit vorgenommen. Nach der Bearbeitung aller 
unmittelbaren Nachfolger stellt der Slave dem Master die Knoteninformationen und 
die Ergebnisse der Bearbeitung der Teilprobleme zur Verfiigung. Hierbei ist es 
ausreichend, nur Daten der zulassigen Knoten zur Verfiigung zu stellen, da an den 
unzulassigen Knoten nicht weiterverzweigt werden mufi und sie damit fur den 
weiteren Verlauf der Bearbeitung nicht mehr von Bedeutung sind. Dies hat den 
Vorteil, dafi fiir den Master die Uberarbeitung der Knotentabelle bzgl. dieser Knoten 
entfallt. Auf der anderen Seite miissen jedoch neben den Ergebnissen auch die 
Knoteninformationen dem Master zur Verfiigung gestellt werden. 
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Abbildung 12: Ablaufdiagramm Parallelisierungsvariante I 
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SLAVE 




Abbildung 13: Ablaufdiagramm Parallelisierungsvariante II 

Neben der Knotentabelle beim Master existieren bei dieser Parallelisierungsvariante 
auch bei den einzelnen Slaves Knotentabellen. Sie enthalten jeweils die fur die Bear- 
beitung der unmittelbaren Nachfolger des ihnen zugeteilten Teilproblems relevanten 
Informationen. Da nur noch die Informationen dem Master zur Verfiigung gestellt 
werden, die fur den weiteren Verlauf der Baumabarbeitung von Bedeutung sind, 
enthalt die Knotentabelle beim Master nicht mehr die gesamte mit der Baumabarbei- 
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tung im Zusammenhang stehende Information. Neben der Verteilung der Kontrolle 
ist demnach auch eine Verteilung der Daten vorgenommen worden. 

In der Abbildung 13 findet sich der Ablauf fur die Parallelisierungsvariante II, 
wobei auf eine detaillierte Darstellung des Masters verzichtet werden kann, da der 
Ablauf genau wie bei der Parallelisierungsvariante I ist. 

5.2.2.3. Parallelisierungsvariante III 

Eine noch grobere Granulierung lafit sich erreichen, wenn nicht nur eine Stufe, son- 
dern mehrere Stufen oder sogar ganze Aste autonom berechnet werden. Wahrend 
die Parallelisierungsvarianten I und II sowohl fur die best-first-Suche als auch fur 
die vorgestellte kombinierte Tiefen- und best-first-Suche realisiert werden konnen, 
ist die unabhangige Bearbeitung mehrerer Stufen oder gar ganzer Aste nur bei der 
kombinierten Tiefen- und best-first-Suche sinnvoll. 

Der Master bestimmt, genau wie bei Parallelisierungsvariante II, einen Knoten, an 
dem noch weiterverzweigt werden mufi, und stellt diesen einem von ihm ebenfalls 
ausgewahlten Slave zur Verfugung. Der Slave bestimmt und bearbeitet dann nach- 
einander zunachst alle unmittelbaren Nachfolger dieses Knotens und wertet jeweils 
das Ergebnis der Bearbeitung aus. Da im Gegensatz zur Parallelisierungsvariante II 
der Master den Slaves auch die Bound-Information zur Verfugung stellt, umfafit die 
Auswertung nicht nur eine Priifung auf Zulassigkeit, sondern auch eine Priifung 
hinsichtlich des Bounds. Existiert nach der Bearbeitung aller unmittelbaren Nachfol- 
ger noch mindestens ein Knoten, an dem weiterverzweigt werden mufi, stellt der 
Slave die Informationen dieser Knoten dem Master zur Verfugung, wahlt den besten 
Knoten aus und beginnt wieder mit der Bearbeitung der unmittelbaren Nachfolger 
des von ihm ausgewahlten Knotens. Dieser Vorgang wird solange wiederholt, bis 
entweder kein zu verzweigender Knoten mehr vorhanden ist oder aber die vorgege- 
bene Anzahl zu bearbeitender Stufen erreicht ist. Anschliefiend wartet der Slave 
darauf, dafi er vom Master wieder einen Knoten zur Verfugung gestellt bekommt. 

Auch hier halten die Slaves, genau wie bei der Parallelisierungsvariante II, Knoten- 
tabellen. Da die Slaves auch eine Abfrage beziiglich des Bounds vornehmen und 
damit Informationen zu Knoten, deren Zielfunktionswert geringer als der jeweils 
dem Slave vorliegende Bound ist, dem Master nicht mehr zur Verfugung gestellt 
werden, wird eine weitere Verteilung der Daten erzielt. Diese hat ihre Ursache in 
der weitergehenden Verteilung der Kontrolle. Der Grad der Granulierung ist insbe- 
sondere bei der unabhangigen Bearbeitung ganzer Aste erheblich hoher als bei den 
Varianten I und II. 
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Abbildung 14: Ablaufdiagramm Parallelisierungsvariante III 
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5.2.2.4. Modifizierte Parallelisierungsvarianten la und Ha 

Da insbesondere bei einer geringen Anzahl von Slaves die Aufgaben des Masters 
gegeniiber den Aufgaben der Slaves wesentlich weniger zeitaufwendig sind, wartet 
der Master sehr haufig darauf, dafi er von den Slaves Ergebnisse zur Bearbeitung 
bekommt und den Slaves neue Aufgaben zuteilen kann. Dieses Mifiverhaltnis ver- 
starkt sich durch die zunehmende Verteilung der Kontrolle noch von der Paralleli- 
sierungsvariante I zur Parallelisierungsvariante III, da zwar die Slaves Aufgaben des 
Masters iibernehmen, der Master aber keine Aufgaben der Slaves iibernimmt. Es ist 
daher naheliegend, dafi auch der Master sich an den Aufgaben der Slaves beteiligt. 

Wird die Parallelisierungsvariante I auf diese Weise modifiziert, so sucht auch hier 
der Master zunachst fur alle wartenden Slaves ein Teilproblem aus und stellt den 
Slaves die notwendige Knoteninformation zur Verfiigung. Sind alle Slaves beschaf- 
tigt, wahlt er fiir sich selbst ein Teilproblem aus, berechnet dieses und wertet das 
Ergebnis aus. Erst danach priift er wieder, ob Ergebnisse von den Slaves vorliegen, 
iiberarbeitet, falls dieses der Fall ist, die Knotentabelle und versorgt zunachst die 
wartenden Slaves, bevor er selbst mit der Bearbeitung eines neuen Teilproblems 
beginnt. Der sich gegeniiber der Variante I veranderte Ablauf des Masters ist in 
Abbildung 15 dargestellt. 

Bei der modifizierten Parallelisierungsvariante Ha bearbeitet der Master nicht nur 
einen Knoten, sondern erst alle unmittelbaren Nachfolger eines von ihm zuvor 
bestimmten Knotens, bevor er wieder eventuell wartende Slaves versorgt. Der sich 
daraus gegeniiber der Variante II veranderte Ablauf des Masters findet sich in der 
Abbildung 16. 

5.3. Parallelisierung des speziellen Branch-and-Bound-Algorithmus 

Wahrend die verschiedenen Relaxationen, Verzweigungsarten und Abarbeitungs- 
reihenfolgen der SOS bei alien Parallelisierungsvarianten gleichermafien realisiert 
werden konnen, kann die Suchstrategie best-first-Suche nur bei den Varianten I, II, 
la und Ha gewahlt werden. Die kombinierte Suche dagegen kann zwar bei alien 
Varianten realisiert werden, erscheint jedoch fiir die Parallelisierungsvariante III am 
geeignesten, wenn hier ganze Aste unabhangig bearbeitet werden. 

Soil bei der Variante III die kombinierte Suche nicht auf der Basis der tatsachlichen, 
sondern auf der Basis der geschatzten Zielfunktionswerte erfolgen, so entstehen 
gegeniiber der sequentiellen Verarbeitung mehrere Probleme. 
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Abbildung 15: Ablaufdiagramm Parallelisierungsvariante la 
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Abbildung 16: Ablaufdiagramm Parallelisierungsvariante Ila 
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Zum einen kennt ein Slave, wenn die geschatzten Zielfunktionswerte auf der Basis 
von Pseudokosten oder Zusatz-Pseudokosten berechnet werden, zunachst nur die 
Pseudokosten, die er selbst bestimmt hat. Es besteht zwar die Moglichkeit, dafi die 
Slaves neben der Knoteninformation auch die von ihnen berechneten Pseudokosten 
dem Master zur Verfiigung stellen, damit dieser sie an die anderen Slaves weiterlei- 
ten kann. Da hiermit jedoch ein erheblicher Aufwand verbunden ist, wird darauf 
verzichtet. Dies hat zur Folge, dafi insgesamt wesentlich mehr Pseudokosten berech- 
net werden miissen als bei der sequentiellen Verarbeitung und damit ein Zeitvorteil 
nicht in dem gewiinschten Umfang erzielt werden kann. 

Als ein weiteres Problem bei der Beriicksichtigung geschatzter Zielfunktionswerte 
ist deren Uberarbeitung anzusehen. Diese kann entweder beim Master oder bei den 
Slaves stattfinden. Eine Uberarbeitung beim Master hat den Nachteil, dafi der Master 
zeitweilig nur noch eingeschrankt auf die Anfragen der Slaves reagieren kann und 
bei den Slaves somit langere Wartezeiten entstehen. Eine Uberarbeitung bei den 
Slaves hat den Nachteil, dafi der Master den Slaves zunachst die relevanten Daten 
zur Verfiigung stellen mufi und die Slaves nach der Uberarbeitung der geschatzten 
Zielfunktionswerte die entsprechenden Daten wieder dem Master zur Verfiigung 
stellen miissen. Da mit beiden Moglichkeiten ein erheblicher Aufwand verbunden 
ist, wird im Rahmen der parallelen Verarbeitung auf eine Uberarbeitung der 
Knotentabelle verzichtet. 

5.4. Overheads der Parallelisierung 

Bei der parallelen Verarbeitung ist ein N-fach paralleler Algorithmus in der Regel 
nicht N-mal schneller als ein vergleichbarer sequentieller Algorithmus. Die Zeitdif- 
ferenz zwischen der Bearbeitungszeit des parallelen Algorithmus und der theoreti- 
schen Bearbeitungszeit, die erreicht werden konnte, wenn der sequentielle Algo- 
rithmus N-mal schneller ware, wird als Overhead bezeichnet. Der Overhead hat 
unterschiedliche Ursachen. Je nach Ursache wird von einem Kommunikations-, 
Scheduling-, Synchronisations-, algorithmischen oder einem Overhead aufgrund 
sequentieller Programmteile 218 gesprochen. Die Summe dieser einzelnen Overheads 
ergibt stets den gesamten Overhead. 

Bevor das zu erwartende AusmaJS der einzelnen Overheads fur die unterschiedli- 
chen Parallelisierungsvarianten diskutiert wird, mufi zunachst geklart werden, an 



218 Auf den sequentiellen Overhead wird erst im Kapitel 7 eingegangen. 




121 



welchen Stellen eines parallelen Branch-and-Bound-Algorithmus die unterschiedli- 
chen Overheads auftreten bzw. auftreten konnen. 

Da auf der einen Seite der Master den Slaves die Knoteninformation zur Verfiigung 
stellen mufi und auf der anderen Seite die Slaves dem Master die Ergebnisse ihrer 
Bearbeitung mitteilen miissen, tritt hierdurch ein Kommunikationsoverhead auf. 

Ein Scheduling-Overhead wird hauptsachlich dadurch verursacht, dafi der Zeitauf- 
wand fiir die Bewaltigung der Aufgaben vom Master und von den Slaves sehr 
unterschiedlich ist und dafi zudem die Berechnung der einzelnen Teilprobleme 
unterschiedlich lange dauert. 

Der Synchronisationsoverhead entsteht, wenn der Master nicht sofort auf die 
Anfrage eines Slaves reagieren kann, sondern erst die von ihm gerade ausgefuhrte 
Bearbeitung beenden mu£. 

Neben diesen Overheads ist im Zusammenhang mit dem betrachteten parallelen 
Branch-and-Bound-Algorithmus der algorithmische Overhead von besonderer 
Bedeutung. Er zeigt sich in Form des Such- und des Wiederaufsetz-Overheads. Der 
Such-Overhead entsteht dann, wenn bei der parallelen Bearbeitung mehr Knoten als 
bei der sequentiellen Bearbeitung berechnet werden miissen . 219 Als Wiederaufsetz- 
Overhead wird der zeitliche Mehr aufw and bezeichnet, der dadurch verursacht 
wird, dafi bei der parallelen Verarbeitung pro Knoten zumeist mehr Pivotschritte 
benotigt werden als bei der sequentiellen Verarbeitung, da die Wiederaufsetzmog- 
lichkeit nicht so effizient genutzt werden kann . 220 

5.5. Beurteilung der Overheads fiir die verschiedenen Parallelisie- 
rungsvarianten 

5.5.1. Kommunikationsoverhead 

Bei den Parallelisierungsvarianten I und la mufi den Slaves fiir jeden Knoten, den sie 
bearbeiten, auch eine Knoteninformation zur Verfiigung gestellt werden. Demge- 
geniiber ist es bei den Varianten II und Ha ausreichend, wenn den Slaves nur fiir 



219 SPRAGUE berichtet z.B. von einem besonders drastischen Fall, wo bei der parallelen Bearbei- 
tung eines Knapsack-Problems die Anzahl der behandelten Knoten mehr als 30 mal hoher als bei 
der sequentiellen Verarbeitung ist. Vgl. hierzu: Sprague, A.P.: Wild Anomalies in Parallel Branch 
and Bound, in: Dr. So, K. (Hrsg.), Proceedings of the 1991 International Conference on Parallel 
Processing, Vol. Ill, Algorithms & Applications, August 1991, Pennsylvania State University 
1991, S. 308-309 

220 Vgi. Abschnitt 4.2.3. 
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diejenigen Knoten eine Information zur Verfiigung gestellt wird, deren unmittelbare 
Nachfolger sie bearbeiten sollen. Bei der Variante III mufi den Slaves sogar nur die 
Information fur den Anfangsknoten eines ihnen zur Bearbeitung zugeteilten Astes 
zur Verfiigung gestellt werden. 

Analog benotigt der Master bei den Parallelisierungsvarianten I und la fiir jeden 
Knoten, der bearbeitet worden ist, das Ergebnis dieser Bearbeitung. Bei den Varian- 
ten II und Ha miissen nur noch fiir die zulassigen Knoten Daten zur Verfiigung 
gestellt werden. Da der Master allerdings jeweils neben dem Ergebnis auch die 
Knoteninformation benotigt, lafit sich im vorhinein nicht klaren, ob die Varianten II 
und Ha zu einem geringeren Kommunikationsaufwand als die Varianten I und la 
fiihren. Eine eindeutige Verringerung des Aufwands gegeniiber den Varianten II 
und Ha ergibt sich jedoch fiir die Variante III, da hier neben unzulassigen Knoten 
auch die Knoten nicht zur Verfiigung gestellt werden miissen, deren 
Zielfunktionswert schlechter als der aktuell beste Bound ist. 

Insgesamt ist demnach zu erwarten, daB bei den Parallelisierungsvarianten I und la 
der Kommunikationsoverhead am hochsten und bei der Variante III am niedrigsten 
ist. 

5.5.2. Wiederaufsetz-Overhead 

Bei den Parallelisierungsvarianten I und la ist die Wahrscheinlichkeit, dafi hinterein- 
ander zwei ahnliche Teilprobleme bearbeitet werden, relativ gering. Dadurch kann 
das Wiederaufsetzen insbesondere im Falle mehrfacher Verzweigung nicht so effizi- 
ent wie bei der sequentiellen Verarbeitung genutzt werden. Anders verhalt es sich 
bei den Parallelisierungsvarianten II, Ha und III. Hier werden bei paralleler Verar- 
beitung in gleichem Mafie ahnliche Teilprobleme nacheinander bearbeitet wie bei 
sequentieller Verarbeitung. Damit ist zu erwarten, dafi bei den Parallelisierungsvari- 
anten I und la ein relativ hoher und bei den Varianten II, Ha und III kein Wiederauf- 
setz-Overhead auftritt. 

Eine Abhangigkeit von der Anzahl der beteiligten Prozesse kann sich demnach nur 
fiir die Parallelisierungsvarianten I und la ergeben. Da die Wahrscheinlichkeit, hin- 
tereinander zwei ahnliche Teilprobleme zu bearbeiten, mit zunehmender Anzahl 
von Prozessen sinkt, ist in diesem Fall auch von einem steigenden Wiederaufsetz- 
Overhead auszugehen. 

5.5.3. Such-Overhead 

Bei der sequentiellen Verarbeitung wird bei der best-first-Suche grundsatzlich ein 
Knoten bearbeitet, dessen Vorganger von den noch zu bearbeitenden Knoten den 
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besten Zielfunktionswert aufweist. Dadurch ist gewahrleistet, daB keine uberfliissi- 
gen Knoten bearbeitet werden miissen. Bei den Parallelisierungsvarianten I und la 
dagegen werden zu jedem Zeitpunkt die Nachfolger der (N-l)/S bzw. N/S Knoten 
bearbeitet, die von den noch zu verzweigenden Knoten die besten Zielfunktionswer- 
te aufweisen. 221 Wird nun ein besserer Bound als der schon vorhandene ermittelt, so 
ist es moglich, daB der Bound besser als einige von den (N-l)/S bzw. N/S Knoten 
mit den besten Zielfunktionswerten ist und demzufolge iiberflussige Knoten berech- 
net werden. Dieses fiihrt zu einem Such-Overhead. 

Da die Anzahl derjenigen Knoten, deren Nachfolger zu einem Zeitpunkt bearbeitet 
werden, bei der Mehrfachverzweigung geringer als bei der Binarverzweigung ist, ist 
weiterhin zu erwarten, daB der Such-Overhead bei den Varianten I und la im Falle 
der Mehrfachverzweigung geringer ist. 

Bei den Parallelisierungsvarianten II und Ha werden im Gegensatz zu den Varianten 
I und la die Nachfolger der N-l bzw. N besten Knoten bearbeitet (vgl. hierzu die 
Abbildung 17). Hierdurch ist zum einen die Wahrscheinlichkeit groBer, daB die 
Zielfunktionswerte der Knoten, an denen gerade verzweigt wird, schlechter sind als 
ein neu ermittelter Bound. Zum anderen miissen alle unmittelbaren Nachfolger 
bearbeitet werden, da der Master die Bound-Information nicht an die Slaves weiter- 
leitet. Wahrend bei den Varianten I und la also schlimmstenfalls N-l bzw. N Knoten 
iiberfliissigerweise bearbeitet werden, konnen dieses bei den Varianten II und Ha 
sogar (N-1)*S bzw. N*S Knoten sein. Es ist daher zu erwarten, daB der Such- 
Overhead bei den Varianten II und Ha hoher als bei den Varianten I und la ist. 

Ein Vergleich von binarer und mehrfacher Verzweigung laBt vermuten, daB bei den 
Parallelisierungsvarianten II und Ha im Gegensatz zu den Varianten I und la die 
Mehrfachverzweigung den hoheren Such-Overhead liefern wird, da bei einem 
Binarbaum pro Knoten hochstens zwei unmittelbare Nachfolger iiberfliissigerweise 
bearbeitet werden, wahrend dieses bei einem Mehrfachbaum auch mehr als zwei 
sein konnen. 

Ferner ist auch mit einem Anstieg des Such-Overheads bei einer steigenden Anzahl 
von Prozessen zu rechnen, weil in diesem Fall die Wahrscheinlichkeit zunimmt, daB 
iiberfliissige Knoten bearbeitet werden. 



22 1 N ist die Anzahl der Prozesse und S die Anzahl der unmittelbaren Nachfolger aller Knoten. Der 
Einfachheit halber wird hierbei unterstellt, dafi alle Knoten die gleiche Anzahl von unmittel- 
baren Nachfolgem aufweisen. 
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Bei der Parallelisierungsvariante III werden in der Regel sowohl bei der sequentiel- 
len als auch bei der parallelen Verarbeitung uberfliissige Knoten bearbeitet, so dafl 
sich eine Abschatzung des Such-Overheads nur schwer vornehmen laflt. Es ist 
jedoch moglich, dafl bei der parallelen Verarbeitung deutlich mehr Knoten als bei 
der sequentiellen Verarbeitung bearbeitet werden mussen, obwohl der Master den 
Slaves die Bound-Information zur Verfiigung stellt. Dies soil folgender Fall verdeut- 
lichen: 

Wird bei der sequentiellen Verarbeitung der optimale Zielfunktionswert im ersten 
Teilast bestimmt und werden damit keine iiberfliissigen Knoten bearbeitet, so ist bei 
der parallelen Verarbeitung nicht mehr gewahrleistet, dafl keine iiberfliissigen 
Knoten berechnet werden, da in der Zeit, bis einer der N an der Bearbeitung betei- 
ligten Prozesse den optimalen Zielfunktionswert erreicht hat, die anderen Prozesse 
schon eine Vielzahl von iiberfliissigen Knoten bearbeitet haben konnen. 

5.5.4. Scheduling-Overhead 

Bei den Parallelisierungsvarianten I, II und III sind die Aufgaben des Masters im 
Vergleich zu den Aufgaben der Slaves von derart geringem Zeitaufwand, dafl der 
Master die meiste Zeit auf die Slaves wartet. Bei den Varianten la und Ha dagegen 
beteiligt sich der Master auch an den Aufgaben der Slaves, so dafl ein wesentlich 
ausgewogeneres Verhaltnis bzgl. des Zeitaufwands erzielt wird. Aus diesem Grund 
ist zu erwarten, dafi die Parallelisierungsvarianten la und Ha einen erheblich gerin- 
geren Scheduling-Overhead als die Varianten I, II und III besitzen. 

5.5.5. Synchronisationsoverhead 

Hat ein Slave die ihm zugeteilte Aufgabe ausgefiihrt, mufl er darauf warten, dafl der 
Master ihm eine neue Aufgabe zuteilt. Die Lange der Wartezeit hangt davon ab, wie 
schnell der Master auf die Forderung des Slaves eingehen kann. Da bei den Paralle- 
lisierungsvarianten I, II und III der Master die meiste Zeit nur darauf wartet, dafl die 
Slaves eine neue Aufgabe von ihm anfordern, ist davon auszugehen, dafl die Warte- 
zeit relativ kurz ist. Bei den Varianten la und Ha dagegen bearbeitet der Master 
selbst auch Teilprobleme, so dafl er haufig nicht sofort auf die Erfordernisse der 
Slaves reagieren kann. Aus diesem Grund wird hier die Wartezeit und damit auch 
der Synchronisationsoverhead wesentlich hoher als bei den Varianten I, II und III 
sein. 

Aufgrund der Tatsache, dafl die Slaves bei den Varianten I und la nach jedem 
Knoten, bei den Varianten II und Ha nach der Bearbeitung aller unmittelbaren 
Nachfolger eines Knotens und bei Variante III erst am Ende der Bearbeitung eines 
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Teilastes auf den Master warten miissen, kann weiterhin angenommen werden, dafi 
der Synchronisationsoverhead von Variante I bzw. Ia zu Variante III abnimmt. Aus 
dem gleichen Grund ist bei den Parallelisierungsvarianten II und Ha zu vermuten, 
dafi der Synchronisationsoverhead bei binarer Verzweigung hoher als bei 
mehrfacher Verzweigung ist, da bei binarer Verzweigung schon nach zwei Knoten 
auf die Zuweisung einer neuen Aufgabe gewartet werden mufi, wahrend dieses 
beim Mehrfachbaum erst nach mehr als zwei Knoten der Fall ist. 

In Abhangigkeit von der Anzahl eingesetzter Prozesse ist des weiteren zu erwarten, 
dafi sich der Synchronisationsoverhead bei einer steigenden Anzahl von Prozessen 
ebenfalls erhoht, da der Master dann zunehmend zum EngpaiS wird. 

In der Tabelle 8 findet sich noch eine Ubersicht, die den Umfang der einzelnen 
Overheads relativ zueinander ausweist. 



Overhead/ Variante 


I 


II 


III 


Ia 


Ha 


Kommunikationsoverhead 


hoch 


mittel 


niedrig 


hoch 


mittel 


Wiederaufsetz-Overhead 


hoch 


kein 


kein 


hoch 


kein 


Such-Overhead 


niedrig 


hoch 


hoch 


niedrig 


hoch 


Scheduling-Overhead 


hoch 


hoch 


hoch 


niedrig 


niedrig 


Synchronisationsoverhead 


mittel 


niedrig 


niedrig 


hoch 


hoch 



Tabelle 8: Gegenuberstellung der einzelnen Overheads 
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5.6. Leistungsbetrachtungen 

Fur die Bearbeitungszeit, die ein paralleler Branc±i-and-Bound-Algorithmus zur 
Losung eines ganzzahligen bzw. gemischt-ganzzahligen Optimierungsproblems 
benotigt, und dem damit verbundenen Speedup lassen sich sowohl globale 222 als 
auch detaillierte Abschatzungen 223 machen. 

Im Zusammenhang mit der globalen Speedup- Abschatzung hat sich herausgestellt, 
dafi bei parallelen Branch-and-Bound-Algorithmen Anomalien auftreten konnen, 
und zwar im einzelnen 

- die 'acceleration anomaly', bei der der Speedup unter Verwendung von N Pro- 
zessen grofier als N ist, 

- die 'deceleration anomaly', bei der der Speedup zwischen 1 und N liegt, und 



222 Vgl. hierzu: Lai, T.-H., Sahni, S.: Anomalies in Parallel Branch-and -Bound Algorithms, Technical 
Report 82-25, Computer Science Department, Institut of Technology, University of Minnesota, 
Minneapolis, Dezember 1982; Quinn, M., Deo, N.: An upper bound for the speedup of parallel 
branch-and-bound algorithms. Technical Report CS-83-112, Computer Science Department, 
Washington State University, Mai 1983; Lai, T.-H., Sprague, A.: Performance of Parallel Branch- 
and-Bound Algorithms, in: DeGroot, D. (Hrsg.), Proceedings of the 1985 International Confe- 
rence on Parallel Processing, August 1985, Pennsylvania State University 1985, S. 194-201; Li, G.- 
J., Wah, B.W.: Coping with Anomalies in Parallel Branch-and-Bound Algorithms, IEEE 
Transactions on Computers, Vol. C-35, Nr. 6, Juni 1986, S. 568-573 

223 So wird von HUANG und DAVIS fur eine Implementation auf einem stark gekoppelten Multi- 
prozessorsystem eine obere Grenze fur den Speedup ermittelt. Der Schwerpunkt liegt hierbei 
auf der Erfassung des Synchronisationsoverheads, der beim Zugriff auf die gemeinsame Kno- 
tentabelle entsteht. Dieser kann bei einer sehr grofien Tabelle im Verhaltnis zur Bearbeitungszeit 
der Knoten relativ grofi werden und darf somit nicht vemachlassigt werden. Die Abbildung des 
Overheads erfolgt mit Hilfe eines einfachen Warteschlangenmodells. Die Warteschlange bilden 
hierbei diejenigen Prozesse, die auf die gemeinsame Knotentabelle zugreifen wollen. Weitere 
Overheads werden als nicht vorhanden angenommen. Vgl. hierzu: Huang, S.-R., Davis, L.S.: 
a.a.O., S. 5 

Von BOXMA und KINDERVATER wurde ebenfalls ein Warteschlangenmodell entwickelt. Im 
Gegensatz zu der Entwicklung von HUANG und DAVIS analysiert es jedoch die Implementati- 
on einer Master-Slave-Verarbeitung. Es existieren hierbei zwei Warteschlangen, und zwar die 
Warteschlange am Master, die dadurch entsteht, dafi die Slaves ihr Ergebnis an den Master zu- 
riickschicken, und die Warteschlange an den Slaves, die dadurch entsteht, dafi nach einer An- 
laufphase zu einem Zeitpunkt i.a. mehr Knoten zur Bearbeitung vorhanden sind als Prozesse 
zur Bearbeitung zur Verfiigung stehen. Das entwickelte Warteschlangenmodell liefert insbeson- 
dere Erkenntnisse dariiber, wie sich die Bearbeitungszeit in Abhangigkeit von der Anzahl einge- 
setzter Prozessoren und bei einer Veranderung der Geschwindigkeit des Masters und der Slaves 
verhalt. Vgl. hierzu: Boxma, O.J., Kindervater, G.A.P.: a.a.O. 

JANAKIRAM, GEHRINGER, AGRAWAL und MEHROTRA haben eine Abschatzung fur einen 
zufalligen parallelen Branch-and-Bound-Algorithmus vorgenommen. Vgl. hierzu: Janakiram, 
V.K., Gehringer, E.F., Agrawal, D.P., Mehrotra, R.: a.a.O. 
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- die 'detrimental anomaly', bei der der Speedup kleiner als 1 ist. 224 

Hierbei ist die 'acceleration anomaly' gleichbedeutend mit einem superlinearen 
Speedup. 

Fur parallele Branch-and-Bound-Algorithmen, die auf einer synchronen Verarbei- 
tung beruhen, bei der alle Prozesse gleichberechtigt auf eine gemeinsame Knotenta- 
belle zugreifen, lassen sich Bedingungen aufstellen, unter denen die verschiedenen 
Anomalien auftreten. 

Besteht keine Einschrankung fiir die Zielfunktionswerte der einzelnen Knoten, kon- 
nen bei einer best-first Suche alle drei Arten von Anomalien auftreten. Der Beweis ist 
konstruktiv, d.h. es lassen sich Branch-and-Bound-Baume konstruieren, die die ent- 
sprechende Bedingung fiir die jeweilige Anomalie erfiillen. 225 Diese Baume sind 
dadurch gekenrtzeichnet, dafi sehr viele Knoten, insbesondere auch die Nicht-Blatt- 
knoten, den optimalen Zielfunktionswert besitzen. 

Wird von der realitatsnaheren Annahme ausgegangen, dafi mit Ausnahme der 
Blattknoten kein Knoten den optimalen Zielfunktionswert annimmt, so kann im 
Falle einer best-first Suche weder eine 'detrimental' noch eine 'acceleration anomaly' 
auftreten. 226 

Neben dem geringen Realitatsbezug weist der Beweis fiir die Existenz eines superli- 
nearen Speedups noch einen weiteren Schwachpunkt auf. Da viele Knoten den glei- 
chen Zielfunktionswert aufweisen, besteht durch die gewahlte Suchstrategie best- 
first keine eindeutige Abarbeitungsvorschrift mehr. In dem Beweis wird deshalb bei 
mehreren gleichen Zielfunktionswerten der nachste zu bearbeitende Knoten will- 
kiirlich gewahlt. Um einen richtigen Vergleich zwischen sequentieller und paralleler 
Bearbeitung zu bekommen, sollte jedoch eine konsistente Suchstrategie benutzt wer- 
den. 227 Unter dieser einschrankenden Bedingung lafit sich fiir die bisher betrachtete 
synchrone Verarbeitung zeigen: 

- Superlinearer Speedup kann auftreten, wenn die Tiefensuche angewandt wird 
oder wenn bei einer best-first Suche einige der Nicht-Blattknoten den optimalen 
Zielfunktionswert besitzen. Ansonsten kann ein superlinearer Speedup nicht auf- 
treten. 



224 Huang, S.-R., Davis, L.S.: a.a.O., S. 1 

225 Lai, T.-H., Sahni, S.: a.a.O., S. 5 ff 

226 Lai, T.-H., Sahni, S.: a.a.O., S. 7 und S. 11 

227 Li, G.-J., Wah, B.W.: a.a.O., S. 573 
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- Andererseits kann ein Speedup kleiner als 1 grundsatzlich verhindert werden, 
wenn eine eindeutige Suchstrategie verwendet wird. 228 

Da die in dieser Arbeit betrachteten Parallelisierungsvarianten jedoch nicht auf einer 
synchronen Verarbeitung mit gemeinsamer Knotentabelle beruhen, sind auch die 
globalen Abschatzungen nicht moglich. Es miissen daher zur Leistungsanalyse 
dediziertere Abschatzungen vorgenommen werden. 

5.6.1. Analysemodelle 

Im folgenden werden zunachst fiir die im Abschnitt 5.2.2. vorgestellten Parallelisie- 
rungsvarianten Analysemodelle entwickelt, die das zeitliche Verhalten der verschie- 
denen Varianten unter Einbeziehung der auftretenden Overheads abbilden sollen. 
Anhand dieser Modelle werden dann anschliefiend Abschatzungen beziiglich des 
erreichbaren Speedups vorgenommen. 

5.6.1.1. Annahmen 

Um die Rechenbarkeit der Modelle zu gewahrleisten, miissen einige vereinfachende 
Annahmen getroffen werden. 

(1) Die Zeit, die der Master benotigt, um einem Slave die notwendige Knotenin- 
formation zur Verfiigimg zu stellen, ist konstant. 

(2) Die Zeit, die ein Slave benotigt, um dem Master das Ergebnis einer Knotenbe- 
arbeitung zur Verfiigung zu stellen, ist unabhangig von der Anzahl der auf 
einmal zur Verfugung gestellten Ergebnisse konstant. 

(3) Eine Zwischenspeicherung von Ergebnissen der Slaves ist nicht moglich, so dafi 
beim Master zu einem Zeitpunkt hochstens ein Ergebnis zur Bearbeitung vor- 
liegt. 

(4) Die Zeit fiir die Uberarbeitung der Knotentabelle ist unabhangig vom Prozefi 
und konstant. 

(5) Die Zeit fiir die Berechnung eines Knotens ist unabhangig vom Prozefi und 
konstant. 

(6) Die Zeit fiir die Suche eines Knotens ist unabhangig vom Prozefi und konstant. 

(7) Die Zeit fiir den Auf- und den Abbau der parallelen Verarbeitung ist zu ver- 
nachlassigen. 



228 Li, G.-J., Wah, B.W.: a.a.O., S. 571 
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(8) Die Anzahl der insgesamt zu berechnenden Knoten ist nicht abhangig von der 
Anzahl der eingesetzten Prozesse. 

(9) Die Anzahl der auf den Slaves und ggf. dem Master jeweils bearbeiteten Kno- 
ten ist gleich hoch. 

(10) Es ist immer ein zu bearbeitender Knoten vorhanden, so dafi hierdurch keine 
Wartezeiten entstehen konnen. 

(11) Die Anzahl der unmittelbaren Nachfolger ist fur alle Nicht-Blattknoten des 
Baumes gleich. 

Da die Zeit fur das Einlesen der Eingabedaten unabhangig von der Anzahl einge- 
setzter Prozesse und der gewahlten Parallelisierungsvariante ist, wird sie aus der 
Betrachtung ausgeschlossen. Die Gesamtbearbeitungszeit umfafit daher die Zeit von 
der Bestimmung des ersten zu bearbeitenden Knotens bis zur Uberarbeitung der 
Knotentabelle fur das Ergebnis des letzten bearbeiteten Knotens. 



5.6.I.2. Symbolverzeichnis 

Es werden folgende Symbole benotigt: 

ts [ZE] Bearbeitungszeit, die sowohl der Master als auch die 

Slaves benotigen, um einen Knoten zur Bearbeitung 
zu bestimmen 



tk 

to 



[ZE] Bearbeitungszeit, die der Master zur Uberarbeitung 
der Knotentabelle benotigt 

[ZE] Bearbeitungszeit, die die Slaves benotigen, um einen 
Knoten zu bearbeiten 229 



f w Faktor, der das Verhaltnis zwischen Bearbeitungs- 

zeit mit und ohne Wiederaufsetzen ausdriickt, 
0 < f w <1 

tc ms [ZE] Zeit, die der Master benotigt, um einem Slave die 

notwendige Knoteninformation zur Verfiigung zu 
stellen 



229 Wird zwischen einer Bearbeitungszeit mit und ohne Wiederaufsetzen unterschieden, so handelt 
es sich um die Bearbeitungszeit ohne Wiederaufsetzen. 
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tc sm 


[ZE] 


Zeit, die ein Slave benotigt, um dem Master das 
Ergebnis der ihm zugeteilten Aufgabe zur 
Verfiigung zu stellen 


tw 


[ZE] 


Wartezeit eines Slaves auf eine neue Aufgabe 


N 




Anzahl beteiligter Prozesse (N-l Slaves und der 
Master) 


K 




Gesamtzahl berechneter Knoten 


M 




Anzahl Knoten, an denen zerlegt werden mufi 


L 




Anzahl Knoten, bei denen ein Ast beginnt 


Ti(N) 


[ZE] 


Gesamtbearbeitungszeit der parallelen Verarbeitung 
unter Benutzung von N-l Slaves und dem Master fur 
Parallelisierungsvariante I 


T n (N) 


[ZE] 


Gesamtbearbeitungszeit der parallelen Verarbeitung 
unter Benutzung von N-l Slaves und dem Master fur 
Parallelisierungsvariante II 


Tiii(N) 


[ZE] 


Gesamtbearbeitungszeit der parallelen Verarbeitung 
unter Benutzung von N-l Slaves und dem Master fur 
Parallelisierungsvariante III 


Tia(N) 


[ZE] 


Gesamtbearbeitungszeit der parallelen Verarbeitung 
unter Benutzung von N-l Slaves und dem Master fur 
Parallelisierungsvariante la 


Tiia(N) 


[ZE] 


Gesamtbearbeitungszeit der parallelen Verarbeitung 
unter Benutzung von N-l Slaves und dem Master fur 
Parallelisierungsvariante Ha 



5.6.I.3. Modell fur Parallelisierungsvariante I 

Bei der Parallelisierungsvariante I ist der Master zeitlich wesentlich geringer belastet 
als die Slaves, so da£ die Gesamtbearbeitungszeit mafigeblich durch die Slaves be- 
einflufit wird. Im folgenden wird die Gesamtbearbeitungszeit deshalb auf der 
Grundlage der von den Slaves benotigten Bearbeitungszeiten ermittelt. 

Bei K Knoten, die bearbeitet werden miissen, und N-l Slaves, mufi jeder Slave unter 
den gegebenen Annahmen K/(N-1) Knoten bearbeiten. Da ein Slave erst mit der 
Knotenbearbeitung beginnen kann, wenn ihm vom Master ein Knoten zur Verfii- 
gung gestellt worden ist, und der Master beziiglich dieses Knotens erst mit der 
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Uberarbeitung der Knotentabelle beginnen kann, wenn der Slave ihm das Ergebnis 
der Knotenbearbeitung zur Verfiigung gestellt hat, umfafit die Bearbeitungszeit fiir 
jeden Knoten mindestens die Zeit tc ms fiir das zur Verfiigungstellen der Knotenin- 
formation, die Zeit to fiir die Knotenbearbeitung, die Zeit tc sm fiir das zur Verfii- 
gungstellen des Ergebnisses und die Zeit tk fiir die anschliefiende Uberarbeitung der 
Knotentabelle durch den Master. Die Suche nach einem neuen Knoten durch den 
Master kann jederzeit erfolgen, da dieser Bearbeitungsschritt bei dem vorgestellten 
Algorithmus keine Abhangigkeit zu einem anderen Bearbeitungsschritt aufweist, 
und wird deshalb, sofern die Zeit hierfiir ausreicht, wahrend der Knotenbearbeitung 
der Slaves durchgefiihrt. Die Zeit ist ausreichend, wenn die Bearbeitung eines Kno- 
tens und das zur Verfiigungstellen des Ergebnisses langer andauert als das Suchen 
von Knoten fiir alle Slaves sowie das Uberarbeiten der Knotentabelle und das zur 
Verfiigungstellen von Knoteninformationen fiir N-2 Slaves. Andernfalls kann die 
Suche nicht vollstandig oder gar nicht parallel vom Master ausgefiihrt werden. Fiir 
die Slaves entsteht dadurch eine zusatzliche Wartezeit tw. 

fo, to+tc sm >(N-l)ts+(N-2)(tk + tc ms ) 

tw= < 

[(N-l) ts + (N-2)(tk + tc ms )- to-tc sm , sonst 



Insgesamt fallt also fiir die Bearbeitung der K Knoten folgender Zeitaufwand an: 

j-(tc ms +to + tc sm + tk + tw) (5.1) 

Der Anfang und das Ende der Bearbeitung jedes Slaves miissen noch gesondert be- 
trachtet werden. Zum einen fallt die Wartezeit tw nicht fiir den ersten und letzten 
Knoten an, so dafi der zuviel beriicksichtigte Zeitaufwand subtrahiert werden mufi. 

-2 tw (5.2) 

Zum anderen mu£ die Wartezeit, die am Anfang und am Ende der Bearbeitung da- 
durch entsteht, dafi noch nicht alle Slaves einen Knoten zur Bearbeitung erhalten ha- 
ben bzw. der Master die Knotentabelle noch nicht beziiglich aller letzten Knoten der 
Slaves iiberarbeiten konnte, bei der Gesamtbearbeitungszeit mit beriicksichtigt wer- 
den. Da derjenige Slave, der am Anfang der Bearbeitung als letztes einen Knoten 
zugeteilt bekommt, nur am Anfang diese Wartezeit aufweist, wird die weitere Be- 
trachtung der Einfachheit halber auf der Basis dieses Slaves durchgefiihrt. 
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Dem letzten Slave kann am Anfang erst dann ein Knoten zugeteilt werden, wenn 
alle anderen Slaves schon einen Knoten zur Bearbeitung vom Master erhalten haben 
und fiir den letzten Slave schon ein Knoten bestimmt worden ist. Es ergibt sich 
damit der zusatzliche Zeitaufwand 

(N - 1) ts + (N - 2) tc ms (5.3) 

Nachdem dem ersten Slave ein Knoten zugeteilt worden ist, verzogert sich norma- 
lerweise bei jedem weiteren Slave die Anfangszeit der Bearbeitung um die Zeit- 
spanne tk + ts + tc ms , also vom ersten zum letzten Slave um insgesamt 
(N - 2) (tk + ts + tc ms ) Zeiteinheiten. Eine Ausnahme bildet die Zuteilung des ersten 
Knotens fiir jeden Slave. Hier entsteht lediglich eine Verzogerung von jeweils 
ts + tc ms Zeiteinheiten, da keine Uberarbeitung der Knotentabelle vorgenommen 
werden mufi. Dafiir mufi der letzte Slave jedoch nach der Bearbeitung seines ersten 
Knotens noch 

(N - 2) tk (5.4) 

Zeiteinheiten warten. 

Wird statt des letzten Slaves ein anderer Slave betrachtet, so ist die Wartezeit am 
Anfang geringer, aber dafiir am Ende um den gleichen Betrag hoher. 

Insgesamt ergibt sich fiir die Gesamtbearbeitungszeit beim Einsatz von N Prozessen 
somit folgende Formel: 

Tl(N)= f^T (tCms+t ° + tCsm+tk + tW) (5-5) 

-2 tw + (N - 1) ts + (N - 2) (tk + tc^ ) 

In den Abbildungen 18 und 19 findet sich der zeitliche Ablauf fiir die Falle tw = 0 
und tw > 0. Fur den Fall tw = 0 wurden folgende Bearbeitungszeiten gewahlt: 



ts 


0.3 


ZE 


to 


3.5 


ZE 


tc ms = 


0.7 


ZE 


t c sm = 


0.7 


ZE 


tk = 


0.8 


ZE 









Zur Darstellung des Falles tw > 0 wurde lediglich die Knotenbearbeitungszeit ent- 
sprechend verringert, und zwar auf to = 2.5 ZE. Die Anzahl der beteiligten Prozesse 
betragt in beiden Fallen N = 4 und die Knotenanzahl K = 9 . 





Abbildung 18: Zeitlicher Ablauf der Parallelisierungsvariante I bei tw 





Abbildung 19: Zeitlicher Ablauf der Parallelisierungsvariante i bei tw>0 
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5.6.I.4. Modell fur Parallelisierungsvariante II 

Bei der Parallelisierungsvariante II bestimmt der Master einen Knoten, dessen 
unmittelbare Nachfolger dann erst noch von dem Slave, dem der Knoten zugeteilt 
worden ist, bestimmt werden miissen. Die Ergebnisse fur die unmittelbaren Nach- 
folger eines Knotens werden auf einmal dem Master zur Verfiigung gestellt. Die 
Formel (5.1) von Parallelisierungsvariante I mufi daher in zwei Summanden aufge- 
teilt werden. Der erste Summand umfafit die Zeiten fur diejenigen Tatigkeiten, die 
fiir alle Knoten durchgefiihrt werden miissen, und der zweite Summand beriick- 
sichtigt die Zeiten fiir diejenigen Tatigkeiten, die insgesamt nur M-mal ausgefiihrt 
werden miissen. 

~~ (ts + to) + ^~^-j- (tc sm + tk + tc ms + tw) (5.6) 

Fiir die Wartezeit tw gilt in diesem Fall: 



o. 



(N- 1) ts + (N - 2) (tk + tc ms )-— (ts + to)- tc 



^•(ts + to) + tc sm >(N-l)ts + (N-2)(tk + tc ms ) 



sonst 



Der weitere Aufwand ist identisch mit dem Aufwand fiir die Parallelisierungsvari- 
ante I, so dafi fiir die Gesamtbearbeitungszeit von Parallelisierungsvariante II gilt: 

T Il( N ) = jvj- 1 ( ts + to ) + N _ 1 ( tc ms + tc sm + tk + tw) ^ ^ 

-2 tw + (N-1) ts + (N-2) (tk + tc ms ) 

Fiir den Fall tw = 0 findet sich in Abbildung 20 der zeitliche Ablauf. Als Knoten- 
bearbeitungszeit wurde hier to = 1. 7 ZE gewahlt. Die Gesamtzahl zu berechnender 
Knoten betragt 18 und die Anzahl Knoten, an denen weiterverzweigt werden mufi, 

9. 





Abbildung 20: Zeitlicher Ablauf der Parallelisierungsvariante II bei tw : 
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5.6.I.5. Modell fur Parallelisierungsvariante III 

Die Parallelisierungsvariante III zeichnet sich dadurch aus, dafi ein Slave nicht nur, 
wie bei Variante II, alle unmittelbaren Nachfolger eines Knotens selbstandig bearbei- 
tet, sondern ganze Aste des Baumes. Da die Anzahl der zu bearbeitenden Knoten 
eines Astes nicht a priori zu bestimmen ist, ist der zeitliche Ablauf nicht so festgelegt 
wie bei den Varianten I und II. Es werden daher noch einige vereinfachende 
Annahmen getroffen. 

(12) Stellt ein Slave einem Master ein Ergebnis zur Verfiigung und for der t einen 
neuen Knoten an, so wird zum einen davon ausgegangen, dafi der Master 
schon einen zu bearbeitenden Ast bestimmt hat, und zum anderen, dafi der 
Slave nicht warten mufi, bis der Master mit der Uberarbeitung der Knotenta- 
belle beginnt. Es entsteht demnach keine Wartezeit dadurch, daP der Master 
gerade mit einer anderen Aufgabe beschaftigt ist. 

(13) Der Zeitaufwand, der dadurch verursacht wird, dafi der Master den Slaves 
einen neuen Bound zur Verfiigung stellt, ist so gering, dafi er vernachlassigt 
werden kann. 



Die Annahme (12) erscheint nicht allzu realitatsfern, da der Master durch seine Auf- 
gaben derart wenig zeitlich belastet ist, dafi er nahezu immer auf die Erfordernisse 
der Slaves reagieren kann. 

Die Annahme (13) kann ebenfalls als realistisch angesehen werden, da in der Re gel 
die Anzahl der zur Verfiigung zu stellenden Bounds im Verhaltnis zur Gesamtzahl 
der zu bearbeitenden Knoten sehr gering ist. 

Ftir jeden Knoten fallt die Zeit fiir die Bestimmung und die Bearbeitung an. Da das 
Ergebnis der Bearbeitung erst dem Master zur Verfiigung gestellt wird, wenn alle 
Nachfolger eines Knotens bearbeitet worden sind, mufi nur fiir M Knoten die Zeit 
beriicksichtigt werden. Wird die Bearbeitung auf die N-l Slaves verteilt, so ergibt 
sich folgende Bearbeitungszeit: 



K . ^ . M 

( tS + tO ) H 3 7 tC 



N-l 



N-l 



(5.8) 



Hat ein Slave einen Ast bearbeitet, mufi er nach dem zur Verfiigungstellen des letz- 
ten Ergebnisses solange warten, bis der Master die Knotentabelle iiberarbeitet und 
den Anfangs knoten eines neuen Astes zur Verfiigung gestellt hat. Es entsteht da- 
durch insgesamt ein zusatzlicher Zeitbedarf von 



N-l 



(tk + tc ms ) 



(5.9) 
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Zeiteinheiten. Hierbei fallt keine Zeit fur die Bestimmung des neuen zu bearbeiten- 
den Astes an, da davon ausgegangen wird, dafi dieser schon in der Zeit bestimmt 
werden konnte, in der der Slave noch mit der Bearbeitung des vorherigen Astes 
beschaftigt war. 

Da genau wie bei Variante I und II der letzte Slave erst mit der Arbeit beginnen 
kann, wenn die anderen N-2 Slaves schon mit einer Aufgabe versorgt sind und fiir 
ihn schon ein Ast zur Bearbeitung bestimmt worden ist, mufi der zusatzliche Zeit- 
aufwand 

(N - 1) ts + (N - 2) tc ms (5.10) 



am Anfang der Bearbeitung beriicksichtigt werden. 

Insgesamt ergibt sich demnach folgende Gesamtbearbeitungszeit fiir die Parallelisie- 
rungsvariante III: 



Tin (N) = ^ (ts + to) + tCsm + (tk + tCms > 

+(N - 1) ts + (N - 2) tc ms 



(5.11) 



In Abbildung 21 ist der zeitliche Ablauf mit den Daten fiir die Parallelisierungsvari- 
ante II dargestellt, wobei fiir L = 2 gewahlt wurde. 

5.6.I.6. Modell fiir Parallelisierungsvariante la 

Bei der Parallelisierungsvariante la ubernimmt der Master zusatzlich zu seiner Kon- 
trollfunktion noch Aufgaben der Slaves mit. Die Gesamtbearbeitungszeit wird hier 
deshalb im Gegensatz zu den Varianten I und II mafigeblich durch den Master be- 
stimmt. Hierbei sind drei Falle zu unterscheiden. 

Ist der Slave, dem jeweils als erstes ein Knoten zur Bearbeitung zugeteilt wird, eher 
mit seiner Aufgabe fertig als der Master mit der Suche und dem zur Verfiigungstel- 
len der Knoteninformationen fiir die anderen N-2 Slaves und mit der Suche nach 
einem Knoten fiir sich selbst, d.h. gilt 230 

(N-l) ts + (N - 2) (tc ms + tk) > to + tc 

sm (5.12) 



230 Qj e Bedingung entspricht genau der Bedingung fiir tw > 0 bei der Parallelisierungsvariante I. 





Abbildung 21: Zeitlicher Ablauf der Parallelisierungsvariante 
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dann mufi der Master schon wieder den ersten Slave versorgen und kann selber 
keine Aufgaben der Slaves iibernehmen. Soli dieses auch am Anfang der Bearbei- 
tung gelten, so mufi die gegeniiber (5.12) starkere Einschrankung 

(N - 1) ts + (N - 2) tc ms > to + tc sm (5.13) 

erfiillt sein. In diesem Fall entspricht die Parallelisierungsvariante la der Variante I 
und die Berechnungsvorschrift fiir die Gesamtbearbeitungszeit berechnet sich nach 
der Formel (5.5), wobei durch die Bedingung (5.13) grundsatzlich tw > 0 erfiillt ist. 

Gilt dagegen 

(N - 1) ts + (N - 2) (tk + ts + tc ms ) > to + tc sm > (N - 1) ts + (N - 2) tc ms (5.14) 

so andert sich gegeniiber der Parallelisierungsvariante I lediglich die Anfangsphase. 
Wie die Abbildung 23 zeigt, fiihrt an jedem Slave die Bearbeitung des zweiten Kno- 
tens zu dem gleichen zusatzlichen Zeitaufwand wie die Bearbeitung des jeweils 
ersten Knotens. Beriicksichtigt werden muF hierbei jedoch noch, dafi eine zeitliche 
Verschiebung dadurch hervorgerufen wird, dafi der Master fiir sich einen Knoten 
zur Bearbeitung bestimmt, diesen bearbeitet und anschliefiend die Knotentabelle 
iiberarbeitet, wahrend die Slaves nur ihren Knoten bearbeiten und das Ergebnis dem 
Master zur Verfiigung stellen miissen. Es ergibt sich dadurch fiir den Fall, dafi (5.14) 
gilt, folgende Gesamtbearbeitungszeit: 

T Ia (N) = T I (N)+ ts + tk - tc sm + (N - 1) ts + (N - 2) tc ms (5.15) 

zusatzlicher Zeitaufwand am Anfang der Bearbeitung 

1st der Master eher mit der Bearbeitung eines Knotens und der Suche nach einem 
neuen Knoten fertig als der erste Slave mit seiner Knotenbearbeitung, miifite unter 
der Annahme konstanter Knotenbearbeitungszeit auf der Seite des Masters und der 
Slaves gelten 

(N-l) (ts + tk) + (N-2) tc ms < tc sm 

Dieser Fall ist als derart praxisfern anzusehen, dafi er im folgenden nicht weiter 
betrachtet werden muF. 
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Tritt dagegen der Fall ein, daB 

( N - 1) ts + (N - 2) (tc ms + tk) < to + tc sm (5.16) 

1st, so bearbeitet der Master, genau wie auch die Slaves, K/N Knoten, fur deren Be- 
arbeitung jeweils die Zeit ts fur die Suche des Knotens, die Knotenbearbeitungszeit 
to und die Zeit tk fur die Uberarbeitung der Knotentabelle anfallen. 

^(ts + to + tk) (5.17) 

Des weiteren mufi der Master jedesmal vor der Bearbeitung seines Knotens fur die 
N-l Slaves einen Knoten zur Bearbeitung bestimmen und die entsprechende Knoten- 
information jeweils den Slaves zur Verfiigung stellen und nach der Bearbeitung sei- 
nes Knotens die Knotentabelle beziiglich der Ergebnisse der N-l Slaves iiberarbeiten. 
Hierdurch ergibt sich ein weiterer Zeitaufwand. 

~ (N - 1) (ts + tc ms + tk) (5.18) 

Fur die Gesamtbearbeitungszeit von Parallelisierungsvariante la beim Einsatz von N 
Prozessen gilt demnach: 

Tja (N) = — (ts + to + tk 4 - (N — 1) (ts + tc ms -f tk)) (5.19) 

Fur den Fall tw = 0 findet sich in Abbildung 22 und fiir den Fall tw > 0 in Abbil- 
dung 23 ein Beispiel. Die Bearbeitungszeiten des Falles tw = 0 sind identisch zu den 
Zeiten bei der Parallelisierungsvariante I. Fiir den Fall tw > 0 wurde als Knotenbe- 
arbeitungszeit to = 2.2 ZE gewahlt. 





Abbildung 22: Zeitlicher Ablauf der Parallelisierungsvariante la bei tw 




Abbildung 23: Zeitlicher Ablauf der Parallelisierungsvariante la bei tw>0 
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5.6.I.7. Modell fur Parallelisierungsvariante Ha 

Analog zur Variante la lafit sich die Mitarbeit des Masters bei Variante Ha nur reali- 
sieren, wenn die Knotensuche und das zur Verfugungstellen der Knoteninformation 
fiir die Slaves nicht langer dauert als die Bearbeitung der einem Slave zugeteilten 
Aufgabe, wobei auch hier wieder die Anfangsphase gesondert betrachtet werden 
mufi. Fiir den Fall, dafi der Master am Anfang noch einen Knoten bearbeitet, mufi 
die Bedingung 

(N - 1) ts + (N - 2) (tc ms + tk) > — (ts + to) + tc sm (5.20) 

M 

gelten und fur den Fall, dafi der Master schon am Anfang keinen Knoten bearbeiten 
kann, die starkere Bedingung 

(N - 1) ts + (N - 2) tc ms > (ts + to) + tc sm (5.21) 

M 

Die starkere Bedingung hat, ahnlich wie bei der Parallelisierungsvariante la, zur 
Folge, dafi sich zwischen den Parallelisierungsvarianten II und Ha kein Unterschied 
mehr ergibt, so dafi in diesem Fall die Formel (5.7) zur Berechnung der Gesamtbear- 
beitungszeit herangezogen werden mufi. Im Falle der schwacheren Bedingung lautet 
die Berechnungsvorschrift wie folgt: 

Tna(N) = T n (N)+ tk - tc sm + (N - 1) ts + (N - 2) tc ms (5.22) 

zusatzlicher Zeitaufwand am Anfang der Bearbeitung 

1st gewahrleistet, dafi der Master sich ebenfalls an der Bearbeitung beteiligen kann, 
so ergibt sich auf seiten des Masters im Zusammenhang mit der Knotenbearbeitung 
gegeniiber der Parallelisierungsvariante la keine Veranderung in der Vorgehenswei- 
se. Dadurch unterscheidet sich die fiir die Knotenbearbeitung benotigte Zeit nicht 
von der Zeit bei der Parallelisierungsvariante la. 

— (ts-fto + tk) (5.23) 

N 

Bei der Versorgung der Slaves durch den Master tritt jedoch eine Zeitersparnis da- 
durch ein, dafi nur noch fur M Knoten die Zeit ts fiir die Knotensuche, die Zeit tc ms 
fiir das zur Verfiigungstellen der Knoteninformation und die Zeit tk fiir die Uberar- 
beitung der Knotentabelle beriicksichtigt werden mufi. Der hier durch verursachte 
Zeitaufwand lautet: 




~ (N - 1) (ts + tc ms + tk) 
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(5.24) 



Als Gesamtbearbeitungszeit fiir Parallelisierungsvariante Ha ergibt sich demnach: 

Tna (N) = £ (ts + to + tk) + M (N - 1) (ts + tc ms + tk) (5.25) 

Fiir die Darstellung des zeitlichen Ablaufs in der Abbildung 24 wurden die Daten 
von Parallelisierungsvariante II fiir den Fall tw = 0 herangezogen. 

5.6.2. Beriicksichtigung des Wiederaufsetz-Overheads 

Die Annahme konstanter Knotenbearbeitungszeiten und konstanter Knotenanzah- 
len, die dazu fiihrt, dafi kein Wiederaufsetz- und kein Such-Overhead auftritt, mufi 
als eine schlechte Abbildung der Realitat angesehen werden. Daher wird das Modell 
zumindestens beziiglich des Wiederaufsetz-Overheads entsprechend modifiziert. 
Der Such-Overhead dagegen wird nicht weiter untersucht, da er als nicht vorher- 
sehbar anzusehen ist. 

Fiir die Beriicksichtigung des Wiederaufsetz-Overheads wird zwischen einer Bear- 
beitungszeit ohne und einer Bearbeitungszeit mit Wiederaufsetzen unterschieden. 
Die Bearbeitungszeit mit Wiederaufsetzen bedeutet, dafi eine schon vorhandene 
Basis, wenn sie als Ausgangsbasis fiir die LP-Optimierung herangezogen wird, 
einen Vorteil gegeniiber einer neuen Basis bringt. Die Bearbeitungszeit ohne Wie- 
deraufsetzen dagegen bedeutet, dafi kein Vorteil zu erzielen ist, wenn eine schon 
vorhandene Basis als Ausgangsbasis genommen wird. 

Statt der Annahme (5) werden folgende Annahmen eingefiihrt: 

(5a) Die Bearbeitungszeiten ohne und die Bearbeitungszeiten mit Wiederaufsetzen 
sind jeweils konstant. 

(5b) Die Bearbeitungszeit ohne Wiederaufsetzen betragt ein konstantes Vielfaches 
der Bearbeitungszeit mit Wiederaufsetzen. 

Bei Parallelisierungsvariante I und la wird jeder Knoten einzeln von einem Slave 
bearbeitet, so dafi der Vorteil des Wiederaufsetzens nicht genutzt werden kann. Die 
Gesamtbearbeitungszeiten berechnen sich daher auch weiterhin nach den Formeln 
(5.5) und (5.15) bzw. (5.19). 





Abbildung 24: Zeitlicher Ablauf der Parallelisierungsvariante 1 1 a bei tw 
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Bei Parallelisierungsvariante II und Ha dagegen muB nur jeweils fur den ersten 
Nachfolger der M Knoten, an denen weiter zerlegt werden muB, die Bearbeitungs- 
zeit ohne Wiederaufsetzen angesetzt werden. Bei den anderen Nachfolgern, dessen 
Anzahl sich als Differenz aus der Gesamtanzahl und der Anzahl Knoten, die weiter 
zerlegt werden miissen, ergibt, vermindert sich die Bearbeitungszeit um den Wie- 
deraufsetzfaktor. 

Die Formeln fiir die Gesamtbearbeitungszeit lauten hier dann: 

Tjj(N) = ts + f w ton (tc ms + to + tc + tk + tw) 

11 N - 1 N - 1 w N-l s sm (5.26) 

-2 tw + (N - 1) ts + (N-2)(tk + tc ms ) 



T IIa (N) = ^(ts + t k ) + K N M f w to + ^(to + (N-l)(ts + tc ms + tk)) (5.27) 



Bei Parallelisierungsvariante III bearbeitet jeder Slave einen ganzen Ast, so dafi nur 
fiir den ersten zu bearbeitenden Knoten des Astes die erhohte Knotenbearbeitungs- 
zeit anzusetzen ist. Fiir alle anderen Nachfolger in einem Ast wird nur die Bearbei- 
tungszeit mit Wiederaufsetzen benotigt. 



T III (N) = 



K L K-L 

tS H 

N-l N-l 



M 

to + tc s 

N-l s 



+ N _ 1 (to + tk + tc ms ) 



+(N - 1) ts + (N - 2) tc ms 



(5.28) 



5.6.3. Speedup-Abschatzungen 

Der Speedup berechnet sich nach folgender Formel 



S(N) = 



T(l) 

T(N) 



(5.29) 



wobei 

S(N) Speedup beim Einsatz von N Prozessen 

T(l) [ZE] Bearbeitungszeit bei sequentieller Verarbeitung 

Bevor der Speedup berechnet werden kann, muB zunachst die Bearbeitungszeit fiir 
die sequentielle Verarbeitung ermittelt werden. 
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5.6.3.1. Bearbeitungszeit der sequentiellen Verarbeitung 

Wird bei der parallelen Verarbeitung von konstanten Knotenbearbeitungszeiten 
ausgegangen, mufi auch bei der sequentiellen Verarbeitung nicht zwischen einer 
Knotenbearbeitungszeit mit und einer Knotenbearbeitungszeit ohne Wiederaufset- 
zen unterschieden werden. Fiir jeden der K zu bearbeitenden Knoten fallt demnach 
die Zeit ts fur die Suche des nachsten Knotens, die in diesem Fall fiir alle Knoten 
gleiche Knotenbearbeitungszeit to und die Zeit tk fiir die Uberarbeitung der Knoten- 
tabelle an. 

T(l) = K (ts + to + tk) (5.30) 

Wird dagegen der Wiederaufsetz-Overhead beriicksichtigt, so ist die Gesamtbearbei- 
tungszeit von der eingesetzten Suchstrategie abhangig. Wird eine best-first-Suche 
realisiert, so weist der erste unmittelbare Nachfolger eines ausgewahlten Knotens im 
Gegensatz zu den anderen unmittelbaren Nachfolgern i.a. keine ahnliche Struktur 
gegeniiber dem zuvor berechneten Knoten auf, so dafi hier das Wiederaufsetzen kei- 
nen Zeitvorteil bringt. Bei der kombinierten Suche gilt dieses nur fiir den ersten 
Knoten eines Teilastes. 

T bf (1) = M to 4 - (K - M) f w to + K (ts + tk) (5.31) 

T kb (1) = L to + (K - L) f w to + K (ts + tk) (5.32) 

Mit Hilfe dieser Gesamtbearbeitungszeiten der sequentiellen Verarbeitung wird nun 
versucht, den zu erreichenden Speedup abzuschatzen. 

5.6.3.2. Speedup-Abschatzungen ohne Beriicksichtigung des Wiederaufsetz- 
Overheads 

5.6.3.2.I. Parallelisierungsvariante I 

Fiir die Parallelisierungsvariante I berechnet sich der Speedup nach folgender For- 
mel: 

o K (ts + to + tk) 

Si (N) = 

j(tc m s+to + tCs m +tk + tw) + (N- 1 )ts + (N- 2 )(t k + t c m s)-2 tw 

am Anfang benotigte Zeit 



(5.33) 
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Es wird zunachst eine Abschatzung fur den Fall tw = 0 vorgenommen, indem die 
am Anfang benotigte Zeit vemachlassigt wird. 



S!(N)<(N-1) 



ts + to + tk 



kms + to -I- tc sm + tk 



(5.34) 



Hierbei zeigt sich, dafi in dem Fall, wo der Kommunikationsaufwand hoher ist als 
die Zeit fur die Bestimmung des nachsten zu bearbeitenden Knotens, d.h. wo gilt 

tc m s+tc sm >ts (5.35) 



der Speedup grundsatzlich nicht grofier als N-l werden kann. 
Da fur tw > 0 die Abschatzung 



Si(N)<- 



K (ts + to + tk) 



(tc ms + to + tc sm + tk) + (N - 1) ts + (N - 2) (tk + tc ms ) 



N-l 



(5.36) 



moglich ist, gilt die Abschatzung (5.36) unter der Bedingung (5.35) auch fur den Fall 
tw > 0, so daB auch hier ein zu hoher Kommunikationsaufwand im Verhaltnis zum 
Aufwand fur die Bestimmung des nachsten zu bearbeitenden Knotens zu einem 
maximalen Speedup von N-l fiihrt. 

Die Hohe des zu erreichenden Speedups ist demnach zum einen ganz wesentlich 
von der Anzahl eingesetzter Prozesse abhangig. Zum anderen beeinfluBt aber das 
Verhaltnis zwischen der Zeit fur die Bestimmung des nachsten zu bearbeitenden 
Knotens und der Kommunikationszeit die Hohe des Speedups. 

Anschaulich laBt sich letzteres leicht herleiten, wenn die bei der sequentiellen Verar- 
beitung auszufuhrenden Arbeitsschritte den bei der parallelen Verarbeitung auszu- 
fiihrenden Arbeitsschritten gegeniibergestellt werden. Da sowohl bei der sequentiel- 
len als auch bei der parallelen Verarbeitung fur K Knoten die Zeit fur die Berech- 
nung der Knoten und die anschlieBende Uberarbeitung der Knotentabelle anfallt, 
laBt sich hierdurch weder eine Zeitersparnis noch ein Mehraufwand gegeniiber der 
jeweils anderen Verarbeitungsweise erzielen. Anders verhalt es sich beziiglich der 
Zeit fiir die Bestimmung des nachsten zu bearbeitenden Knotens und der Kommu- 
nikationszeit. Wahrend die Zeit fiir die Bestimmung des nachsten zu bearbeitenden 
Knotens zwar bei der sequentiellen Verarbeitung, nicht aber bei der parallelen Ver- 
arbeitung beriicksichtigt werden mufi, gilt fiir die Kommunikationszeit genau der 
umgekehrte Fall, so dafi das Verhaltnis der beiden Zeitaufwande zueinander fiir die 
Hohe des zu erreichenden Speedups von Bedeutung ist. 
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Fur ts > tc ms + tc sm kann der Speedup zwar grofier als N-l werden, wenn die An- 
fangszeit vernachlassigt wird, allerdings nur solange wie tw = 0 gilt. Fur tw > 0 
mufi eine andere Abschatzung vorgenommen werden. 

Durch Umformung ergibt sich aus (5.33) 



Si(N) = (N-l) - 



ts + to + tk 



N-l 

, + to + tc sm + tk + tw + ( to + tc«> 



(5.37) 



tc r 



K 



- tw) 



Da es nur sinnvoll ist, maximal soviel Slaves einzusetzen, wie Knoten bearbeitet 
werden miissen, kann folgende Abschatzung vorgenommen werden: 

Si (N) < (N-i) t s + to + tk_i (53g) 

^ C ms + to + tc sm + tk — ( to + tc sm ) 



5.6.3.2.2. Parallelisierungsvariante II 

Fur die Parallelisierungsvariante II ergibt sich folgende Formel fur den Speedup: 



S n (N) = 



K (ts + to + tk) 

j(ts + to) + ^Z^( tc ms + tc sm + tk + tw) 
+(N - 1) ts + (N - 2) (tk + tc ms ) - 2 tw 



am Anfang benotigte Zeit 



(5.39) 



Da auch hier, ahnlich wie bei Parallelisierungsvariante I, gilt 

K (ts + to + tk) 



S n (N): 



K (ts + to) + “~ 7 (tc ms + tc sm + tk) + (N - 1) ts + (N - 2) (tk + tc ms ) 



N-l 



N-l 



ms/ 

(5.40) 



ist die Abschatzung fur den Fall tw = 0 gleichermafien erfiillt wie fur den Fall 
tw > 0. 

Wird die am Anfang benotigte Zeit vernachlassigt, so folgt: 

K (ts + to + tk) 



S„(N)<(N-1) 



K(ts + to) + M(tc ms +tc sm +tk) 



(5.41) 
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Das bedeutet, dafi der Speedup grundsatzlich nicht grofier als N-l werden kann, 
wenn 

(K - M) tk < M (tc ms + tc sm ) (5.42) 

gilt. Dieses lafit sich aus folgender Uberlegung ableiten: 

Die Uberarbeitung der Knotentabelle muB bei der parallelen Verarbeitung im 
Gegensatz zur sequentiellen Verarbeitung nur M-mal durchgefuhrt werden, so dafi 
sich gegeniiber der sequentiellen Verarbeitung eine Zeitersparnis von 
(K - M) tkergibt. Auf der anderen Seite entsteht bei der parallelen Verarbeitung der 
Kommunikationsaufwand, der bei der sequentiellen Verarbeitung nicht anfallt. Er ist 
jedoch im Gegensatz zur Variante I geringer, da er nur fur M und nicht fur K Knoten 
beriicksichtigt werden mufi. Die Zeit fur die Knotensuche ergibt keine Zeitersparnis, 
da jeder Slave die unmittelbaren Nachfolger der ihm zur Bearbeitung zugeteilten 
Knoten erst noch bestimmen mufi. Im Gegensatz zur Parallelisierungsvariante I, bei 
der der Speedup durch das Verhaltnis der Kommunikationszeit zur Zeit fur die 
Bestimmung des nachsten zu bearbeitenden Knotens bestimmt wird, ist also bei der 
Parallelisierungsvariante II der Speedup, wie die Bedingung (5.42) auch zeigt, vom 
Verhaltnis der Kommunikationszeit zur Zeit fur die Uberarbeitung der Knoten- 
tabelle abhangig, wobei auch die Knotenanzahl und die Anzahl der Knoten, an 
denen weiterverzweigt werden mufi, eine Rolle spielen. 



5.63.2.3. Parallelisierungsvariante III 

Fur die Parallelisierungsvariante III lautet die Formel fur den Speedup wie folgt: 

K(ts + to + tk) 



Sffl (N) = ■ 



K 



N-l 



( ts + to ) + 



M 

N-l 



- tc s 



N-l 



(tk + tc ms ) + (N-l) ts + (N-2) tc r 



am Anfang 
benotigte Zeit 

(5.43) 



Da hier auf gr und der vereinfachenden Annahmen keine Wartezeit beriicksichtigt 
werden mufi, ist keine Fallunterscheidung notwendig. Eine Abschatzung lafit sich 
daher sofort erreichen, indem die am Anfang benotigte Zeit aus der Betrachtung 
ausgeschlossen wird. 

K ( ts + to + tk ) 



S,„(N)<(N-1) 



K (ts + to) + M tc sm + L (tk + tc ms ) 



(5.44) 
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Hieraus folgt, dafi der Speedup nicht grofier als N-l ist, wenn 

(K - L) tk < M tc sm + L tc ms (5.45) 

ist. Genau wie bei der Parallelisierungsvariante II zeigt sich auch hier wieder die 
Abhangigkeit zwischen der Zeit fur die Uberarbeitung der Knotentabelle und der 
Kommunikationszeit. Allerdings ist neben der Knotenanzahl und der Anzahl der 
Knoten, an denen weiterverzweigt werden muiS, auch noch die Anzahl der Aste von 
Bedeutung. 

Da die Zeit fiir die Uberarbeitung der Knotentabelle bei der parallelen Verarbeitung 
nur noch dann anfallt, wenn ein Slave einen Ast bearbeitet hat und auf einen neuen 
Ast wartet, entsteht bei der Parallelisierungsvariante III gegenuber der sequentiellen 
Verarbeitung eine Zeitersparnis von (K-L)tk. Der Kommunikationsaufwand ver- 
ringert sich gegenuber der Variante II noch weiter, da die Knoteninformation nicht 
mehr M-mal, sondern nur noch L-mal zur Verfugung gestellt werden mufi. 



5.6.3.2.4. Modifizierte Parallelisierungsvarianten la und Ha 

Bei den Parallelisierungsvarianten la und Ha wird nur der Fall betrachtet, dafi der 
Master sich iiber den gesamten Bearbeitungszeitraum auch an der Bearbeitung der 
Knoten beteiligen kann. Fiir den Speedup von Variante la und Ha gilt in diesem Fall 



Sia(N) = N 



ts + to + tk 

ts + to + tk + ( N — 1) ( ts + tc ms + tk ) 



(5.46) 



S na (N) = N- 



ts + to + tk 
M 



ts + to + tk H (N — 1) (ts + tc ms + tk) 

K 



(5.47) 



Durch die Mitarbeit des Masters an der Knotenbearbeitung wird jetzt zum einen die 
Arbeit nicht mehr hauptsachlich auf N-l, sondern auf N Prozesse verteilt, und zum 
anderen wird die Gesamtbearbeitungszeit durch den Master bestimmt. Gegenuber 
der sequentiellen Verarbeitung ergibt sich gerade durch diese erweiterte Aufgabe 
des Masters ein zusatzlicher zeitlicher Aufwand, der bewirkt, dafi der Speedup 
unter den gemachten Annahmen nie grofier als N werden kann. Wie weit der 
Speedup unterhalb des Maximalwerts von N liegt, hangt vom Verhaltnis zwischen 
der Bearbeitungszeit ts + to + tk und dem zusatzlichen zeitlichen Aufwand 

M 

(N-l) (ts + tc ms +tk) bzw. — (N-l)(ts + tc ms +tk) 
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ab. 1st die Bearbeitungszeit hoch im Verhaltnis zum zusatzlichen Zeitaufwand, so ist 
der Speedup nur wenig geringer als N. Ist sie dagegen gering, liegt der Speedup 
deutlich unter N. 



5.6.3.3. Speedup-Abschatzungen unter Beriicksichtigung des Wiederaufsetz- 
Overheads 



Wird der Wiederaufsetz-Overhead berticksichtigt, so mufi der Speedup fur die Pa- 
rallelisierungsvarianten I, II, la und Ha auf der Basis der Gesamtbearbeitungszeit der 
best-first-Suche und fur die Parallelisierungsvariante III auf der Basis der Gesamt- 
bearbeitungszeit der kombinierten Suche ermittelt werden. Es lassen sich dann fol- 
gende Abschatzungen vornehmen: 



S!(N)<(N-1) 



M (K-M) £ 

— to -I- - f w to + ts 4- tk 

_K K w 

ms to + tc sm + tk 



(5.48) 



S„(N)<(N-1) 

S m (N)<(N-l) 



M to + (K-M) f w to + K (ts + tk) 

K ts + (K - M) f w to + M (tc ms + to + tc sm + tk) 

L to + (K - L) f w to -(- K (ts + tk) 

K ts + M tc sm + (K - L) f w to + L (to + tk + tc ms ) 



M (K -M) 

— to -i- f w to + ts + tk 

S u (N) = N — K , K _ ,, , — < N 



Sii a (N)=N 



(5.49) 



(5.50) 



(5.51) 



ts + to + tk + (N - 1) (ts + tc ms + tk) 

M to + (K - M) f w to + K (ts + tk) 

K (ts + tk) + (K - M) f w to + M (to + (N - 1) (ts + tc ms + tk)) (5.52) 



< N 



Fur die Parallelisierungsvariante I kann demnach der Speedup nicht grofier werden 
als N-l, wenn gilt: 



ts < tc sm + tc ms + ( 1 f w ) 



(K-M) 

K 



to 



(5.53) 



Gegeniiber der Bedingung (5.35) erweitert sich die rechte Seite durch die Beriick- 
sichtigung des Wiederaufsetz-Overheads um den Term 



(1-fw) 



(K-M) 

K 



to 




155 



Es ist leicht zu sehen, dafi fiir f w = 0, d.h. die Bearbeitungszeiten mit und ohne Wie- 
deraufsetzen sind gleich, die Bedingung (5.53) der Bedingung (5.35) entspricht. Sind 
die Knotenbearbeitungszeiten nicht gleich, so fallt bei sequentieller Verarbeitung fiir 
K-M Knoten die kiirzere Bearbeitungszeit an, wahrend bei paralleler Verarbeitung 
grundsatzlich die hohere Bearbeitungszeit beriicksichtigt werden mufi. Es zeigt sich 
auch, dafi je hoher der Wiederaufsetz-Overhead ist, umso hoher mufi ts sein, damit 
der Speedup nicht grundsatzlich geringer als N-l ist. Auf der anderen Seite bedeutet 
dieses aber auch, dafi bei gleicher Zeit fiir die Bestimmung des nachsten zu bearbei- 
tenden Knotens und gleicher Kommunikationszeit der Speedup unter Beriicksichti- 
gung des Wiederaufsetz-Overheads geringer als ohne Beriicksichtigung des Wieder- 
aufsetz-Overheads ist. 

Da bei der Parallelisierungsvariante II und III sowohl bei sequentieller als auch bei 
paralleler Verarbeitung bei K-M Knoten bzw. K-L Knoten die kiirzere und bei den 
restlichen M bzw. L Knoten die hohere Bearbeitungszeit herangezogen werden mufi, 
fallt kein Wiederaufsetz-Overhead an. Es kann demnach auch hier der Speedup 
nicht grofier als N-l werden, wenn die Bedingung (5.42) bzw. (5.45) erfiillt ist. 

Bei den Parallelisierungsvarianten la und Ha kann, genau wie ohne die Beriicksich- 
tigung des Wiederaufsetz-Overheads, der Speedup nie grolier als N werden. 

5.6.3.4. Gegeniiberstellung der geschatzten Speedups 

Im folgenden werden die auf der Basis der Analysemodelle ermittelten Speedups 
der verschiedenen Parallelisierungsvarianten gegeniibergestellt, der Einflufi der ein- 
zelnen Bearbeitungszeiten sowie der Art der Verzweigung auf die Hohe des 
Speedups betrachtet und gepriift, ob der Einsatz einer sehr hohen Anzahl von Pro- 
zessen sinnvoll ist. Eine Einbeziehung des Wiederaufsetz-Overheads findet hierbei 
nicht statt. 

Fiir die Gegeniiberstellung der Speedups der verschiedenen Parallelisierungsvarian- 
ten wird folgende Situation zugrunde gelegt: 



ts 


0.01 


ZE 


K = 


500 


t c ms = 


0.05 


ZE 


M = 


250 


tk = 


0.02 


ZE 


L = 


50 


to = 


3 


ZE 






t c sm = 


0.05 


ZE 
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Werden in den Diagrammen 3 a-d die Parallelisierungsvarianten I, II und III be- 
trachtet, so ist der auf den geschatzten Gesamtbearbeitungszeiten basierende 
Speedup bei der Parallelisierungsvariante III am hochsten und bei der Variante I am 
niedrigsten, wobei die Differenz mit zunehmender Anzahl von Prozessen noch zu- 
nimmt, da der Speedup bei Variante III zwar auch nicht linear, aber dennoch mehr 
als bei Variante II und insbesondere bei Variante I ansteigt. 





— linear 1 II 


- 4 - III 


-•-la — lla 





— linear-*™! -*-H 


-^lll 


la — lla 






— linear l -*- ll -»-lll 




— — linear — II III 


la — lla 




la - — lla 



Diagramm 3 a-d: Speedups auf der Basis der Analysemodelle 

Der Speedup der Parallelisierungsvarianten la und Ha variiert in Abhangigkeit von 
der Anzahl eingesetzter Prozesse. Er weist vier Phasen auf. In einer ersten Phase bei 
einer relativ geringen Anzahl von Prozessen ist er hoher als bei den Varianten I und 
II. Dieses ist darauf zuruckzufuhren, daE hier die Mitarbeit des Masters bei der 
parallelen Verarbeitung zu einer Verkiirzung der Gesamtbearbeitungszeit fiihrt. In 
einer zweiten Phase ist er geringer, da hier die Mitarbeit des Masters verstarkt zu 
Wartezeiten bei den Slaves fiihrt. Der Anstieg des Speedups mit zunehmender Pro- 
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zefizahl nimmt hier deutlich ab, bis zur dritten Phase. Am Anfang der dritten Phase 
dagegen findet ein sprunghafter Anstieg des Speedups statt gefolgt von einem fast 
konstanten Speedup. Dieses ist der Bereich, wo der Master zu Beginn der Bearbei- 
tung sich noch an der Knotenbearbeitung beteiligen kann. Am Anfang der vierten 
Phase ist dann noch einmal ein Anstieg, und zwar genau auf den Wert von Paralle- 
lisierungsvariante I bzw. II, da damit der Punkt erreicht ist, wo der Master derart 
mit der Versorgung der Slaves beschaftigt ist, dafi er sich gar nicht mehr an der 
Knotenbearbeitung beteiligen kann und damit die Parallelisierungsvarianten la bzw. 
Ila den Varianten I bzw. II entsprechen. 

Die im Diagramm 4a dargestellte Ausgangssituation fur die Untersuchung des Ein- 
flusses der einzelnen Bearbeitungszeiten sowie der Art der Verzweigung auf die 
Hohe des Speedups lautet folgendermafien: 



ts = 


0.01 


ZE 


K 


= 500 


t c ms = 


0.05 


ZE 


M 


= 250 


tk = 


0.02 


ZE 


L 


= 50 


to 


2 


ZE 






t c sm = 


0.05 


ZE 







Es zeigt sich, dafi die Veranderung der Knotenbearbeitungszeit einen entscheiden- 
den Einflufi auf den Speedup hat. So steigt bei einer Erhohung der Knotenbearbei- 
tungszeit (von 2 ZE auf 10 ZE) der Speedup erheblich an. Ferner wird bei den Paral- 
lelisierungsvarianten la und Ila der Zeitpunkt, bei dem der Master sich nicht mehr 
an der Bearbeitung beteiligen kann, erst bei einer hoheren Anzahl von Prozessen 
erreicht. 

Die Erhohung der Kommunikationszeit (von 0.05 ZE auf 0.1 ZE) dagegen fiihrt 
erwartungsgemafi bei alien Parallelisierungsvarianten zu einer Verminderung des 
Speedups. Der Zeitpunkt, bei dem die Parallelisierungsvarianten la und Ila in die 
Varianten I und II iibergehen, wird schon bei einer geringeren Anzahl von Prozessen 
erreicht. 
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Die Art der Verzweigung hat nur einen relativ geringen EinfluE auf die Hohe des 
Speedups. Lediglich bei der Parallelisierungsvariante Ha laEt sich eine Erhohung des 
Speedups bei mehrfacher Verzweigung (Anzahl unmittelbarer Nachfolger = 4) 
gegeniiber binarer Verzweigung feststellen. 

Die Erhohung der Zeit fiir die Knotensuche (von 0.01 auf 0.05) ftihrt zu ahnlichen 
Veranderungen wie die Erhohung der Kommunikationszeit. Auch hier verringert 
sich einerseits der Speedup und andererseits ist die Mitarbeit des Masters bei den 
Parallelisierungsvarianten la und Ha schon bei einer geringeren Anzahl von Prozes- 
sen nicht mehr moglich. 

Die Veranderung der Zeit fiir die Uberarbeitung der Knotentabelle hat, wie erwartet, 
bei der Parallelisierungsvariante III nur einen sehr geringen EinfluE auf den 
Speedup, da die Uberarbeitung gemaE der Annahme (12) nur fiir L Knoten einen 
erhohten Zeitaufwand verursacht und ansonsten parallel zur Knotenbearbeitung der 
Slaves durchgeftihrt wird. Bei den anderen Varianten dagegen fiihrt eine Erhohung 
(von 0.02 auf 0.1) zu einer Verringerung des Speedups. AuEerdem gehen schon bei 
einer deutlich geringeren Anzahl von Prozessen die Parallelisierungsvarianten la 
und Ha in die Varianten I und II iiber. 

In den Diagrammen 5 a-d wird der Speedup bei einer groEen Anzahl von Prozessen 
untersucht. Da eine groEe Anzahl nur bei einem entsprechend komplexen Problem 
sinnvoll ist, werden folgende Daten zugrunde gelegt: 



ts 


1.0 


ZE 


K 


= 100000 


t c ms = 


0.5 


ZE 


M 


= 50000 


tk = 


0.2 


ZE 


L 


= 5000 


to 


120 


ZE bzw. 300 ZE 






tC sm = 


0.5 


ZE 







Es zeigt sich, daE sowohl bei der Parallelisierungsvariante I als auch bei der Paralle- 
lisierungsvariante II ab einer bestimmten Anzahl von Prozessen der Speedup nahezu 
konstant bleibt. Es handelt sich hierbei um den Zeitpunkt, wo der Master in der Zeit, 
in der die Slaves die ihnen zugeteilte Aufgabe ausfiihren, nicht alle anderen Slaves 
versorgen kann. Ein anfragender Slave muE daher solange warten, bis der Master 
alle anderen Slaves versorgt hat. 
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Knotenbearbeitungszeit = 1 20 




Prozesse 



— linear 1 -*- II 


-•-III 


la — Ha 





Knotenbearbeitungszeit = 300 




Prozesse 



- — linear-*-! -*-ll 


-■-III 


la — Ma 





Knotenbearbeitungszeit = 1 20 




Prozesse 



— linear -*- 1 -*-ll 


*111 


-•-fa — Ma 





Knotenbearbeitungszeit = 300 




Prozesse 



— linear 1 II 


*111 


-*la — lla 





Diagramm 5 a-d: Speedup bei einer hohen Anzahl von Prozessen mit unterschiedlichen 

Knotenbearbeitungszeiten 

Bei der Parallelisierungsvariante III war die Annahme getroffen worden, dafi der 
Master derart wenig zeitlich belastet ist, daB er immer sofort in der Lage ist, einem 
Slave eine neue Aufgabe zuzuteilen, so dafi fur die Slaves hierdurch keine Wartezeit 
entsteht. Dieses zeigt sich ganz deutlich an den Diagrammen. Es findet hier kein 
Abknicken der Speedup-Kurve statt. Da bei einer sehr hohen Anzahl von Prozessen 
nicht davon ausgegangen werden kann, dafi die Annahme zutrifft, wird der 
Speedup in der Praxis unter dem auf der Basis des Analysemodells ermittelten 
Speedup liegen. 

Zusammenfassend ist also folgendes zu dem auf der Basis der Analysemodelle 
ermittelten Speedup festzustellen. Die Parallelisierungsvariante I liefert den nied- 
rigsten und die Parallelisierungsvariante III den hochsten Speedup. Parallelisie- 
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rungsvariante la und Ha fiihren nur bei einer sehr geringen Anzahl von Prozessen zu 
einem besseren Speedup als die entsprechenden Varianten I und II. Bei den Varian- 
ten I, II, la und Ha wird der Speedup mafigeblich davon beeinflufit, wie hoch die 
Knotenbearbeitungszeit im Verhaltnis zu den anderen Bearbeitungszeiten ist. Hier- 
aus folgt, dafi sich der Einsatz von sehr vielen Prozessen nur bei einer vergleichs- 
weise sehr hohen Knotenbearbeitungszeit lohnt. 




6. Implementation des sequentiellen und des parallelen 
Branch-and-Bound-Algorithmus 

Die im vierten und fiinften Kapitel beschriebenen Verfahrens- und Parallelisie- 
rungsvarianten wurden sowohl auf einem PC- und einem Workstation-LAN als 
auch auf einem Parallelrechner implementiert. 

In den nachsten Abschnitten wird jeweils fur jede der drei Implementationen die 
Hardware beschrieben sowie auf die Einzelheiten zur Realisierung der Kommuni- 
kation und der Losung der kontinuierlichen Optimierungsaufgaben eingegangen. 

6.1. PC-LAN 

6.1.1. Beschreibung der Hardware 

Die erste Implementation erfolgte auf einem PC-LAN. Dieses besteht aus 15 PCs 10 
MHz getaktet, ausgeriistet mit einem Mikroprozessor vom Typ INTEL 80286 und 
einem Koprozessor, 9 PCs 16 MHz getaktet, ausgeriistet mit einem Mikroprozessor 
vom Typ INTEL 80386SX und ebenfalls einem Koprozessor, sowie einem 20 MHz 
getakteten PC, ausgeriistet mit einem Mikroprozessor vom Typ INTEL 80386DX. Die 
Netztopologie weist Bus-Struktur auf. Die Ubertragungsrate betragt 10 Mbit/ sec. 




Abbildung 25: PC-LAN 

6.1.2. Beschreibung der Kommunikationssoftware 

Im Bereich von PC -LANs hat sich allgemein durchgesetzt, ein spezielles PC- 
Betriebssystem verbunden mit einem LAN-Betriebssystem einzusetzen. Das PC- 
Betriebssystem unterstiitzt alle lokal auf dem PC anfallenden Tatigkeiten. Das 
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Netzwerk-Betriebssystem verwaltet das lokale Netzwerk und ist damit fur alle im 
Zusammenhang mit der Benutzung des PC-LANs anfallenden Tatigkeiten verant- 
wortlich. Im vorliegenden Fall wird Novell Netware 286 Vs. 2.15 als Netzwerk- 
Betriebssystem und DOS 5.0 als PC-Betriebssystem eingesetzt. Netware unterstiitzt 
ebenso wie viele andere Netzwerk-Betriebssysteme den File-Server-Ansatz. Das 
Netzwerk-Betriebssystem wird auf einem ausgezeichneten PC des LANs, dem soge- 
nannten File-Server, implementiert. Dieser kann entweder als non-dedicated oder 
dedicated Server installiert sein. Im ersten Fall dient der Server ausschlielilich der 
Netzverwaltung, im zweiten Fall kann er auch fur andere Anwendungen eingesetzt 
werden. Um die Leistungsfahigkeit des File-Servers nicht zu beeintrachtigen, ist er 
non-dedicated installiert. 

Bei der Kommunikation wird zwischen verbindungsloser und verbindungsorientier- 
ter Kommunikation unterschieden. Die verbindungslose Kommunikation lafit nur 
das sogenannte Broadcasting zu. Hierbei mufi keine feste Verbindung zwischen den 
kommunizierenden PCs bestehen. Dafiir kann der Empfanger jedoch eine fur ihn 
bestimmte Nachricht nur empfangen, wenn er sich zum Zeitpunkt der Ankunft der 
Nachricht in einem entsprechenden Empfangsmodus befindet. Andernfalls geht die 
Nachricht verloren. Bei der verbindungsorientierten Kommunikation dagegen wird 
eine feste Verbindung aufgebaut, iiber die dann Nachrichten ausgetauscht werden. 
Es besteht hierbei die Moglichkeit, entweder direkt mit Hilfe von Sockets zwischen 
zwei PCs zu kommunizieren oder aber mit Hilfe von Message Pipes iiber den File- 
Server Nachrichten auszutauschen. Bei diesem indirekten Nachrichtenaustausch 
wird von jedem an der Kommunikation beteiligten PC eine Pipe zum File-Server 
aufgebaut. Eine Nachricht wird dann von einem PC A erst zum File-Server gesendet, 
der sie daraufhin an den empfangenden PC B weiterleitet. Sowohl beim direkten als 
auch beim indirekten Nachrichtenaustausch iiber eine feste Verbindung wird die 
Nachricht solange gespeichert, bis der Empfanger sie abruft. 

Fiir die Programmierung von benutzereigenen Netzwerk-Anwendungen existiert 
eine in C geschriebene Bibliothek von Netware, das API 231 , die alle notwendigen 
Funktionen zur Verfiigung stellt. 



23 ^ API=Application Programmer's Interface 
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Netzwerkfunktion 23 2 


Aufgabe 


GetConnectionN umber 


liefert die Adresse des anfragenden PCs 


Get ObjectConnectionN umbers 


nennt die Adressen aller PCs, die unter der 
vom anfragenden PC spezifizierten Kennung 
eingeloggt sind 


SendBroadcastMessage 


verschickt eine Broadcast 


GetBroadcas t Message 


empfangt eine Broadcast 


SetBroadcastMode 


steuert, ob die Broadcast gespeichert oder 
nicht gespeichert werden soli und ob sie auf 
dem Bildschirm erscheinen oder unterdriickt 
werden soil 


OpenMessagePipe 


baut eine Pipe von einem PC zum File-Server 
auf 


CloseMessagePipe 


baut eine Pipe von einem PC zum File-Server 
ab 


CheckPipeStatus 


fragt ab, ob die Pipe von beiden Seiten korrekt 
aufgebaut ist oder ob sie von einer der beiden 
Seiten nicht aufgebaut ist 


SendPersonalMessage 


verschickt eine Nachricht bis zu einer Lange 
von 126 Zeichen iiber eine Pipe 


GetPersonalMessage 


empfangt eine Nachricht iiber eine Pipe; in der 
Pipe konnen sich zur gleichen Zeit maximal 
nur 6 Nachrichten befinden 



Tabelle 9: Netzwerkfunktionen von Novell Netware fur Broadcasting und indirekten 

Nachrichtenaus tausch 

Wahrend der direkte Nachrichtenaustausch eine aufwendigere Implementation als 
der indirekte Nachrichtenaustausch erfordert, ist der indirekte Nachrichtenaus- 
tausch langsamer und bei einer grofien Anzahl von an der Bearbeitung beteiligten 
PCs kann der File-Server leicht zum Engpafi werden. Da sich jedoch der direkte 
Nachrichtenaustausch als nicht so ausfallsicher wie der indirekte Nachrichtenaus- 
tausch erwiesen hat, wurden weiterfiihrende Untersuchungen lediglich auf der Basis 
des indirekten Nachrichtenaus tauschs durchgefiihrt, so daB im folgenden auch nur 



232 Die Funktionen sind genauer beschrieben in: Novell: C Language Novell API Reference, 1988 
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diese PC-Implementation beschrieben wird. In der Tabelle 9 finden sich die verwen- 
deten Netzwerkfunktionen mit ihren jeweiligen Aufgaben. 

6.1.3. Beschreibung der speziellen Implementation 

Als Programmiersprache wird C eingesetzt 233 . 

Das Programm fur den Master-ProzeB wird auf einem der PCs, der im folgenden 
auch als Master bezeichnet wird, gestartet. Die anderen PCs stehen dann fur das 
Programm der Slave-Prozesse zur Verfiigung. Sie werden analog als Slaves bezeich- 
net. Grundsatzlich ist die Zuteilung der Prozesse auf die einzelnen PCs nicht an 
bestimmte PCs gebunden. Jeder Prozefi kann auf jedem PC mit Ausnahme des File- 
Servers, der, wie oben schon erwahnt wurde, nur fur die Netzverwaltung zur 
Verfiigung steht, gestartet werden. 

Der Master wird im Gegensatz zu den Slaves unter einer speziellen Kennung einge- 
loggt, damit die Slaves ihn als solchen erkennen und die fur die spatere Kommuni- 
kation benotigte Adresse des Masters ermitteln konnen. Die an der Bearbeitung 
beteiligten Slaves dagegen schicken eine Broadcast-Meldung an den Master, in der 
sie ihm ihre eigene Adresse mitteilen. Der Master befindet sich hierzu in einer 
Warteschleife in dem entsprechenden Empfangsmodus, der gleich nach dem Start 
des Programms mit dem Befehl SetBroadcastMode gesetzt wird. Haben sich alle 
Slaves angemeldet, werden durch den Master und die Slaves jeweils die Pipes zum 
File-Server aufgebaut. In der Abbildung 26 ist der Anmeldevorgang noch einmal 
dargestellt. 

Nach dem Aufbau der Pipes beginnt das Einlesen der Eingabedaten. Hierzu mufi 
zunachst vom Benutzer der Name der Eingabedatei eingegeben werden. Dieser wird 
anschliefiend an die Slaves verschickt. Sowohl der Master als auch die Slaves holen 
sich dann jeweils die fur sie relevanten Eingabedaten vom File-Server. 

Beim Nachrichtenaustausch mufi der Empfanger wissen, zu welchem Verschicken 
des Senders die Nachricht gehort. Da das Netzbetriebssystem dieses Problem nicht 
unterstiitzt, wird am Anfang jeder Nachricht ein String mitgeschickt, der es dem 
Empfanger ermoglicht, die Nachricht zu identifizieren. 

Ein weiteres Problem entsteht dadurch, dafi weder das Senden noch das Empfangen 
blockierend wirken, so dafi eine Synchronisation vom Netzbetriebssystem ebenfalls 
nicht unterstiitzt wird. Da jedoch bei der vorliegenden Implementation auf seiten 
des Masters und der Slaves mehrere Stellen existieren, an denen eine Synchronisati- 



233 Es steht hierfiir der Microsoft C5.1 Optimizing Compiler zur Verfiigung. 
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on erforderlich ist, wird diese realisiert, indem eine Nachricht zwischen den zu syn- 
chronisierenden Partnern ausgetauscht wird. Fur den Fall, dafi der Master zuerst an 
einen Synchronisationspunkt gelangt, wartet er solange, bis alle Slaves ihm eine ent- 
sprechende Nachricht gesendet haben. Die Slaves verschicken die entsprechende 
Nachricht erst, wenn sie selbst auch mit der Bearbeitung am Synchronisationspunkt 
angelangt sind. Wird umgekehrt ein Synchronisationspunkt zuerst von den Slaves 
erreicht, mussen sie auf eine entsprechende Nachricht des Masters warten. 




Abbildung 26: Anmeldevorgang im PC-LAN 

Ein Synchronisationspunkt wird notwendig, wenn der Master seinen Teil der Pipe 
zum File-Server aufgebaut hat. Er mufi jetzt solange mit dem Verschicken des 
Namens der Eingabedatei warten, bis auch die Slaves ihren Teil der Pipe zum File- 
Server aufgebaut haben. Hierzu verschicken die Slaves nach erfolgreichem Aufbau 
ihrer Pipe eine entsprechende Nachricht. Hat der Master den Namen der Eingabeda- 
tei verschickt und seine Eingabedaten selbst eingelesen, kann er erst dann mit der 
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Suche des ersten Knotens beginnen, wenn er die Sortierreihenfolge der SOS, den 
ersten zu bearbeitenden SOS und ggf. den ersten Teilungspunkt kennt. Diese Daten 
werden bei den Parallelisierungsvarianten I, II und III von den Slaves, und zwar der 
Einfachheit halber von alien Slaves identisch, berechnet. Der Master mufi daher nur 
solange warten, bis er von dem ersten Slave die Daten erhalt. 

Da das Netzbetriebssystem es nicht ermoglicht, dafi ein Prozefi auf einem PC einen 
Prozefi auf einem anderen PC startet oder beendet, mufi der Master den Slaves auch 
hier eine Nachricht schicken, wenn sie ihren Teil der Pipe schliefien und das 
Programm beenden sollen. 234 

Fur die Losung des kontinuierlichen LP-Problems auf jedem PC wird CPLEX 235 , ein 
in C geschriebener LP-Code, eingesetzt, der in Form von Load-Moduln zur Verfii- 
gung steht und in ein selbst geschriebenes Programm eingebunden werden kann. 

CPLEX bietet eine Reihe von Funktionen an, von denen jedoch nur die in der Tabelle 
12 aufgefiihrten Funktionen benotigt werden. 

Die Funktion chgbds wird hierbei zur Festsetzung der Variablen eingesetzt, indem 
sowohl die Ober- als auch die Untergrenzen der entsprechenden Variablen auf den 
Wert 0 gesetzt werden. 

Die Funktion Ipread bzw. mpsread liest nur die Daten fur die Losung des kontinuierli- 
chen Optimierungsproblems ein. Die Daten fur die SOS sind daher in einer weiteren 
Eingabedatei gespeichert. Diese SOS-Eingabedatei enthalt zum einen die Informa- 
tion, welche Variablen jeweils die binaren SOS bilden. Zum anderen ist aber auch 
gespeichert, welche Variablen hierzu in Beziehung stehen, d.h. welche Variablen 
ebenfalls den Wert 0 annehmen miissen, wenn die binare SOS-Variable den Wert 0 
annimmt. 



234 Ein stark vereinfachter Programmausschnitt findet sich in: Schwartz, B.: Mixed-integer linear 
Optimization on a PC-Net, in: Grauer, M., Prefimar, D.B. (Hrsg.), Parallel Computing and 
Mathematical Optimization, Siegen, 1990, Proceedings, Berlin Heidelberg 1991, S. 45-63, hier S. 
60 

233 Es handelt sich hierbei um die Version 1.2. 
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CPLEX-Funktion 236 


Aufgabe 


Ipread bzw. mpsread 237 


liest die LP-Eingabedaten ein 


chgbds 


verandert die Unter- und Obergrenze von Variablen 


optimize 


ftihrt die Optimierung des kontinuierlichen LP-Pro- 
blems durch 


solution 


berechnet den Zielfunktionswert, die Variablenwerte, 
die Werte der Schlupfvariablen, die reduzierten 
Kosten und die Dualwerte eines zuvor optimierten 
Problems 


setadvind 


legt fest, ob auf einer schon vorhandenen Basis aufge- 
setzt werden soil oder nicht 


setreinv 


legt fest, nach wievielen Iterationen eine Reinversion 
der Basisinversen stattfinden soil 



Tabelle 10: CPLEX-Funktionen 

Der Aufbau der SOS-Eingabedatei ist an das MPS-Format angelehnt. Die Datei 
beginnt mit der NAME-Karte und der Bezeichnung des Abschnitts. Da neben der 
Information, welche Variablen einen SOS bilden, auch bestehende Beziehungen 
zwischen den SOS-Variablen und weiteren Variablen des Problems abgebildet 
werden, wurde fur diesen Abschnitt der Name RELATIONS gewahlt. Im Anschlufi 
an die Absc±inittsbezeichnung folgen die Daten, die in bestimmten Spalten der Datei 
beginnen und enden miissen. Abgeschlossen wird die Eingabedatei mit der 
ENDATA-Karte. 238 



23 ^ Eine detaillierte Beschreibung aller CPLEX-Funktionen findet sich in: Using the CPLEX™ 
Callable Library, CPLEX Optimization, Inc., Juni 1989 

232 Fur die Funktion Ipread miissen die Daten in einem speziellen CPLEX-Format vorliegen, wah- 
rend die Funktion mpsread nur Daten einlesen kann, die in dem standardisierten MPS-Format 
abgelegt sind. Das CPLEX-Format weist gegeniiber dem MPS-Format den Vorteil auf, dafi die 
Zielfunktion und die Nebenbedingungen in Anlehnung an die mathematische Schreibweise dar- 
gestellt sind und damit besser nachvollziehbar sind. 

238 Prefimar, D.B.: Ein computergestiitzter Ansatz zur gemischt-ganzzahligen Optimierung unter 
Beriicksichtigung logischer Beziehungen zwischen den Variablen, in: Prefimar, D., Jager, K.E., 
Krallmann, H., Schellhaas, H., Streitferdt, L. (Hrsg.), Operations Research Proceedings, Vortrage 
der 17. Jahrestagung 1988, Berlin Heidelberg 1989, S. 153 
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Spalte 


Inhalt 


2-3 


Kennung, die die Art des SOS kennzeichnet, im vorliegenden Fall 
immer SI fur einen SOS vom Typ 1 


5-9 


Name des SOS 


11-18 


binare SOS-Variable 


21-28 


kontinuierliche SOS- Variable 


31-38 


weitere zu der binaren SOS-Variablen in Beziehung stehende Variable 


41-48 


weitere zu der binaren SOS-Variablen in Beziehung stehende Variable 


51-58 


weitere zu der binaren SOS-Variablen in Beziehung stehende Variable 



Das folgende Beispiel zeigt eine SOS-Eingabedatei mit zwei SOS, dem S001 und dem 
S002, die jeweils aus drei binaren SOS-Variablen Ull, U12, U13 bzw. U21, U22, U23 
bestehen, und zu denen jeweils die in der vierten und fiinften Spalte stehenden 
Variablen in Beziehung stehen. 

NAME Demo 



RELATIONS 








SI 


S001 


Ull 


Til 


Vll 


SI 


S001 


U12 


T12 


V12 


SI 


S001 


U13 


T13 


V13 


SI 


S002 


U21 


T21 


V21 


SI 


S002 


U22 


T22 


V22 


SI 


S002 


U23 


T23 


V23 



ENDATA 

6.1.4. Speicherplatzprobleme durch das Betriebssystem DOS 

Da die Implementation unter dem Betriebssystem DOS erfolgt, ergeben sich weitere 
Schwierigkeiten in bezug auf den zur Verfiigung stehenden Speicherplatz. Es ist 
zwar heutzutage moglich, mit einem DOS Extender auch unter dem Betriebssystem 
DOS mehr als 640 KB Speicher zu nutzen. Da durch den Einsatz eines derartigen 
DOS Extenders jedoch die Anbindung der Netzwerkfunktionen nicht mehr moglich 
gewesen ware, mufite hierauf verzichtet werden. 
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Bei der sequentiellen Verarbeitung miissen sowohl die Knotentabelle als auch die fur 
die Problemlosung relevanten Eingabedaten an einem Prozessor gespeichert wer- 
den. Es lassen sich daher aufgrund der Speicherplatzbeschrankungen nur Probleme 
mit wenigen hundert Variablen und Nebenbedingungen bearbeiten, wobei gleich- 
zeitig die Knotentabelle je nach dem durch das Modell benotigten Speicherplatz 
maximal nicht mehr als 1500 bis 1700 Eintrage haben darf. Werden bei der parallelen 
Verarbeitung die Parallelisierungsvarianten la und Ha realisiert, gilt diese Beschran- 
kung ebenfalls. Bei den Varianten I, II und III dagegen wird die Knotentabelle beim 
Master und die Problemdaten bei den Slaves gehalten. Durch diese Trennung liegt 
beim Master die fiir die Kontrolle notwendige Knotentabelle vor und bei den Slaves 
die Problemdaten und allenfalls im Verhaltnis zur Knotentabelle des Masters kleine 
lokale Knotentabellen. Dadurch ist es zum einen moglich, daB die Knotentabelle bis 
zu 2500 Eintrage enthalten kann, und zum anderen, daB die Probleme groBer sein 
konnen. Eine GroBe von maximal 600 Nebenbedingungen und 1800 Variablen kann 
jedoch auch dann nicht iiberschritten werden. 

Um die Knotentabelle moglichst kurz zu halten, werden Knoten, die unzulassig 
sind, und Knoten, bei denen sich schon sofort nach der Berechnung herausstellt, daB 
sie schlechter als der aktuelle Bound sind, nicht gespeichert. Eine weitere Reorgani- 
sation der Knotentabelle ist nicht implementiert worden. 

Um auch bei einer best-first-Suche das Wiederaufsetzen moglichst effizient nutzen 
zu konnen, ware es sinnvoll, fiir jeden noch zu verzweigenden oder zumindestens 
fiir einige ausgewahlte Knoten auch die Basis zu speichem. Dieses ist aufgrund der 
Speicherplatzbeschrankungen ebenfalls nicht durchgefiihrt worden. 

Des weiteren werden fiir die Uberarbeitung der geschatzten Zielfunktionswerte die 
Werte der binaren und ggf. der kontinuierlichen SOS-Variablen ebenfalls nicht ge- 
speichert. Sie miissen daher jedesmal, wenn sie benotigt werden, zunachst berechnet 
werden. 

6.2. Works tation-L AN 

Aufgrund des zunehmenden Einsatzes von Workstations auch im betriebswirt- 
schaftlichen Bereich und aufgrund der aufgezeigten Einschrankungen der PC-Im- 
plementation, die keine Behandlung von Problemen praxisrelevanter GroBenord- 
nungen zulaBt, wurde auch eine Implementation auf einem Workstation-LAN vor- 
genommen. 




171 



6.2.1. Beschreibung der Hardware 

Es stand ein LAN zur Verfiigung, in dem sich neben relativ leistungsschwachen 
SUN-Workstations auch 3 Sparc- und 3 RS/ 6000- Workstations befanden. 

6.2.2. Beschreibung der Kommunikationssoftware 

Als Betriebssystem lauft auf den Workstations UNIX. Da UNIX als Multitasking- 
und Mehrprozessorbetriebssystem bereits alle fur eine Kommunikation notwendi- 
gen Komponenten zur Verfiigung stellt, ist ein spezielles Netzbetriebssystem wie im 
PC -LAN nicht erforderlich. 

Das Kommunikationskonzept, das die Programmierschnittstelle zu den Anwender- 
programmen darstellt, realisiert einen Nachrichtenaustausch, genau wie bei Novell 
Netware, auf der Basis von Sockets, wobei auch hier eine verbindungslose Kommu- 
nikation in Form des Broadcasting und eine verbindungsorientierte Kommunikation 
mit der Moglichkeit der Nachrichtenspeicherung realisierbar ist. 

6.2.3. Beschreibung der speziellen Implementation 

Als Programmiersprache wird wieder C eingesetzt. 

Fiir den Aufbau der Verbindung erzeugt der Master, der die Funktion des hierfiir 
notwendigen Server-Prozesses iibernimmt, zunachst einen Socket, dem anschlieSend 
eine lokale Adresse zugeordnet werden muB und der dann fiir den Verbindungs- 
aufbau mit der gewiinschten Anzahl Slaves vorbereitet wird. Um die Verbindung 
zum Master aufbauen zu konnen, miissen die Slaves die zuvor dem Master zuge- 
ordnete Adresse kennen. Deshalb schickt der Master ihnen eine entsprechende 
Broadcast-Meldung mit dieser Adresse. Obwohl keine standige Verbindung aufzu- 
bauen ist, mufi jedoch vor dem Verschicken ein entsprechender Socket erzeugt 
werden, dem dann gleichfalls eine lokale Adresse zugeordnet wird. Ist die 
Broadcast-Meldung verschickt worden, wird der hierfiir eingesetzte Socket sofort 
wieder geschlossen. Jetzt wartet der Master nur noch darauf, dafi die Slaves die 
Verbindung aufbauen. 

Damit die Slaves die Broadcast-Meldung des Masters mit seiner lokalen Adresse 
empfangen konnen, miissen sie zunachst hierfiir ebenfalls einen Socket erzeugen 
und auch mit einer lokalen Adresse versehen. Anschliefiend gehen die Slaves in eine 
Warteschleife, solange bis sie die Broadcast-Meldung des Masters erhalten haben. 
Nach Erhalt wird der Broadcast-Socket wieder geschlossen und ein neuer Socket 
erzeugt und mit einer lokalen Adresse versehen, mit dessen Hilfe dann der Aufbau 
einer standigen Verbindung zwischen dem Master und den Slaves durchgefiihrt 
werden kann. 
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Netzwerkfunktion 239 


Aufgabe 


socket 


erzeugt einen Socket 


bind 


ordnet einem Socket eine lokale Adresse zu 


connect 


baut eine standige Verbindung zu einem Server- 
Prozefi auf 


close 


schliePt einen Socket 


listen 


bereitet den Server-Prozefi fur eine standige Verbin- 
dung vor 


sendto 


verschickt eine Meldung ohne standige Verbindung 


recvfrom 


empfangt eine Meldung ohne standige Verbindung 


write 


verschickt eine Meldung iiber eine standige Verbin- 
dung 


read 


empfangt eine Meldung iiber eine standige Verbin- 
dung 


accept 


wartet an einem Server-Prozefi auf eine standige 
Verbindung von einem Socket (wirkt blockierend) 


select 


wartet an einem Server-ProzeP auf eine standige 
Verbindung von mehreren Sockets (wirkt blockierend) 



Tabelle 11: Kommunikationsfunktionen von UNIX 



Das Verschicken und Empfangen einer Nachricht sowie das SchlieBen der Verbin- 
dung ist genauso leicht wie bei der PC-Implementation moglich, so daiS sich im Zu- 
sammenhang mit der Kommunikation keine weiteren Unterschiede ergeben und 
somit auf eine weitere Beschreibung verzichtet werden kann. 



239 Stevens, W.R.: UNIX® Network Programming, Englewood Cliffs New Jersey 1990, S. 258 ff 
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Abbildung 27: Anmeldevorgang im Workstation- LAN 
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Da zunachst kein leistungsfahiger LP-Code verfiigbar war, mufite auf eine Eigen- 
entwicklung eines dualen revidierten Simplexverfahrens zuriickgegriffen werden, 
die im Gegensatz zu kommerziellen LP-Codes sehr leistungsschwach ist. 

Spater stand dann allerdings mit OSL 240 eine LP-Software zur Verfiigung, die auch 
in der Lage ist, Probleme mit mehreren tausend Nebenbedingungen und Variablen 
in vertretbarer Zeit zu losen. Diese Software liegt, genau wie CPLEX, als Load- 
Moduln vor. Obwohl OSL zunachst nur eine FORTRAN-Schnittstelle besafi, wurde 
mit dem hier eingesetzten Release 2 auch eine Schnittstelle zu C realisiert, so dafi 
eine Einbindung in die bestehende Implementation moglich war. 

OSL ist wesentlich umfangreicher als CPLEX. So lafit sich z.B. schnell eine zulassige 
Ausgangslosung erzeugen oder aber fur ein line ares Optimierungsmodell vor dem 
Losen ein Preprocessing durchfiihren. Ferner ist auch in OSL selbst ein Branch-and- 
Bound-Verfahren implementiert. Durch sogenannte User Exit Subroutines besteht 
hierbei fur den Anwender die Moglichkeit, die Abarbeitung des Branch-and-Bound- 
Baumes, wie z.B. die nachste zu verzweigende Variable oder den nachsten zu bear- 
beitenden Knoten, selbst zu bestimmen. Da jedoch trotzdem die Hauptkontrolle von 
OSL ausgefiihrt wird, ist eine Parallelisierung, wie sie im Kapitel 5 beschrieben 
worden ist, mit dem Branch-and-Bound-Verfahren von OSL nicht zu realisieren. Es 
lafit sich jedoch gut fur einen Vergleich zur Eigenentwicklung einsetzen. 

Da unter UNIX keine Speicherbeschrankung mehr durch das Betriebssystem, son- 
dern nur noch durch die Hardware besteht, lassen sich bei ausreichend vorhande- 
nem Speicher auch zu jedem oder zumindestens zu ausgewahlten Knoten die Basen 
speichem. Hierbei stellt sich die Frage, ob eine Speicherung beim Master oder bei 
den Slaves vorgenommen werden soil. Eine Speicherung bei den Slaves hat zur 
Folge, dafi ein Slave vor der Bearbeitung eines Knotens aus den gespeicherten Basen 
eine geeignete Startbasis bestimmen mufi. Geeignet sind in diesem Fall samtliche 
Vor ganger dieses Knotens, wobei der Grad der Eignung mit zunehmender Distanz 
abnimmt, das heifit, der unmittelbare Vorganger ist als beste und die kontinuierliche 
Losung als verhaltnismafiig schlechte Startbasis anzusehen. 



24 0 OSL=Optimization Subroutine Library 
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OSL-Funktionen 241 


Aufgabe 


ekkinit 


initialisiert OSL 


ekkdsca 


alloziiert den Speicherbedarf fiir die Modelldaten 


ekkcrsh 


ermittelt schnell eine Ausgangsbasis 


ekkmpre 


fiihrt ein Preprocessing beziiglich des Branch- 
and-Bound-Baumes durch 


ekkmps 


liest eine Datei im MPS-Format ein 


ekksslv 


lost ein kontinuierliches lineares Optimierungs- 
problem 


ekkmslv 


lost ein gemischt-ganzzahliges Optimierungs- 
problem 


ekkiget 


liefert die Werte der ganzzahligen Kontroll- 
variablen 


ekkrget 


liefert die Werte der reellen Kontrollvariablen 


ekknget 


liefert die Position, wo OSL die Modelldaten 
speichert 


ekkiset 


setzt die ganzzahligen Kontrollvariablen 


ekkrset 


setzt die reellen Kontrollvariablen 



Tabelle 12: OSL-Funktionen 



Werden alle unmittelbaren Nachfolger eines Knotens oder gar ein ganzer Ast unab- 
hangig vom Slave berechnet, so erweist sich die Bestimmung der Startbasis nur bei 
dem jeweils ersten Knoten, den ein Slave unabhangig vom Master bearbeitet, als 
Problem. Ansonsten muB fiir jeden vom Slave zu bearbeitenden Knoten eine Start- 
basis ermittelt werden. Dieses geschieht durch einen Vorwartsvergleich der Knoten- 
auspragung des aktuell zu berechnenden Knotens mit der Knotenauspragung der 
schon berechneten Knoten, der dann den Vorganger mit der geeignesten Startbasis 
liefert. 



241 Es handelt sich hier um die wichtigsten eingesetzten OSL-Funktionen. Die detaillierte Darstel- 
lung aller OSL-Funktionen findet sich in: Optimization Subroutine Library, Guide and Refe- 
rence, Release 2, 3. Aufl., IBM Juli 1991 
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Da die Basen in Form eines Statusvektors abgelegt werden konnen, der relativ wenig 
Speicherplatz erfordert, besteht ferner die Moglichkeit, dafi der Master die Basen 
speichert und zum einen den Slaves neben der Knoteninformation auch die relev an- 
ten Basisinformationen zur Verfiigung stellt und zum anderen von den Slaves neben 
dem Ergebnis die Basisinformationen der neu berechneten Knoten zur Verfiigung 
gestellt bekommt. Da trotz der Speicherung der Basis in Form eines Statusvektors 
Speicherplatzprobleme auftreten konnen, kann es notwendig werden, nicht von 
alien Knoten die Basis zu speichem, sondern nur von ausgewahlten Knoten. Liegt 
dann fiir den unmittelbaren Vorganger keine Basis vor, so mufi der Master einen 
Knoten bestimmen, der stattdessen eine geeignete Startbasis liefern kann. 

Im Gegensatz zu der vorliegenden Version von CPLEX bietet OSL weiterhin die 
Moglichkeit, die Ldsung des kontinuierlichen Optimierungsproblems primal oder 
dual durchzufiihren. Wahrend sich die primale Vorgehensweise im Laufe des 
Optimierungsprozesses von unten her der optimalen Losung nahert, wird bei der 
dualen Vorgehensweise eine Annaherung von oben erreicht, d.h. es gilt: 

fprimali — fprimah+i — ^opt — ^dualj + i — ^dualj ^ M (6-1) 

wobei 

fprimalj Zielfunktionswert der Iteration i bei primalem Vorgehen 

f^al. Zielfunktionswert der Iteration j bei dualem Vorgehen 

f opt Zielfunktionswert der optimalen Losung 

Die Annaherung von oben hat fiir den vorliegenden Fall den Vorteil, dafi in dem 
Moment, wo der Zielfunktionswert im Laufe des Optimierungsprozesses kleiner 
wird als der bisher beste ganzzahlige Zielfunktionswert, die Bearbeitung des gerade 
behandelten Teilproblems vorzeitig abgebrochen werden kann. 

6.3. Massiv paralleler Rechner SUPRENUM 

Neben den LAN-Implementationen wurde noch eine Implementation auf einem 
massiv parallelen Rechner vorgenommen, um einen Vergleich zwischen dem Einsatz 
eines vernetzten Systems fiir die Parallelverarbeitung und eines speziell fiir die 
Parallelverarbeitung entwickelten Parallelrechners zu erhalten. 

6.3.1. Beschreibung der Hardware 

Der SUPRENUM-Rechner ist ein schwach gekoppelter MIMD-Rechner bestehend 
aus bis zu 256 Knotenrechnern mit lokalen Speichereinheiten und einer zweistufigen 
Verb indungs topologie. Jeder SUPRENIJM-Knotenrechner enthalt u.a. einen 32-bit 
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Mikroprozessor, einen 8 MB Speicher, einen skalaren Arithmetikkoprozessor, einen 
Vektorkoprozessor und einen Kommunikationskoprozessor. Bis zu 16 der Knoten- 
rechner bilden einen Cluster. Die Knoten eines Clusters sind iiber einen sehr schnel- 
len Bus, den sogenannten Cluster-Bus, miteinander verbunden. Jeder Cluster besitzt 
zusatzlich noch einen Platten-Anschlufi-Knoten fiir den Anschlufi von bis zu zwei 
Standardplatten, einen Cluster-Diagnose-Knoten fiir Aufzeichnungen von Perfor- 
mance- und Fehlerinformationen und zwei Kommunikationsknoten, die die Verbin- 
dung zum oberen Verbindungssystem herstellen. Das obere System realisiert die 
Verbindung zwischen den einzelnen Clustern mit Hilfe spezieller SUPRENUM- 
Busse, die die Cluster matrixformig verbinden. Das gesamte Clustersystem bildet 
den sogenannten Hochleistungskem, der mit Hilfe eines Front-End-Rechners betrie- 
ben wird. Der Front-End-Rechner ist iiber ETHERNET mit dem SUPRENUM-Rech- 
ner verbunden. 242 




Abbildung 28: S UPRENUM-Cluster 



242 Die Hardwarearchitektur des SUPRENUM-Rechners ist z.B. beschrieben in: Gerndt, M., Thole, 
C.-A., Trottenberg, U., Zima, H.P.: Parallelisierung auf SUPRENUM, Informatik Spektrum, Bd. 
13, Heft 5, Oktober 1990, S. 247-259, hier S. 250; Lemke, M., Schuller, A., Solchenbach, K., 
Trottenberg, U.: Parallel Processing on Distributed Memory Multiprocessors, in: Reuter, A. 
(Hrsg.), GI - 20. Jahrestagung I, Informatik auf dem Weg zum Anwender, Stuttgart, Oktober 
1990, Proceedings, Berlin Heidelberg 1990, S. 15-34, hier S. 21 f 
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6.3.2. Beschreibung der Kommunikationssoftware 

Das SUPRENUM-Betriebssystem besteht aus zwei Komponenten, dem Betriebs- 
system fur das Front-End-System und dem Knotenbetriebssystem. Das Front-End- 
System wird unter UNIX V 243 betrieben; auf jedem Knotenrechner lauft jeweils das 
Knotenbetriebssystem PEACE, das die Prozefi- und Nachrichtenverwaltung regelt. 

Eine parallele Anwendung wird durch ein dynamisches System von Prozessen re- 
prasentiert, wobei jeder Prozefi eine selbstandig ablaufende Programmeinheit ist. 
Die Initialisierung einer parallelen Anwendung erfolgt durch einen initialen Prozefi. 
Wahrend des Prozefiablaufs terminiert jeder einzelne Prozefi, wenn er das Ende 
seiner eigenen Ausfiihrung erreicht oder wenn der initiale Prozefi die gesamte An- 
wendung terminiert. Die Kommunikation zwischen den Prozessen erfolgt durch 
Nachrichtenaustausch. Nachrichten werden direkt an die Zieladresse geschickt. Der 
sendende Prozefi wird dabei nicht blockiert. Die Synchronisation erfolgt beim 
empfangenden Prozefi. 




Abbildung 29: SUPRENUM-Architektur 



24 3 UNIX V ist ein eingetragenes Warenzeichen von AT & T. 
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Als Standard-Programmiersprache wird FORTRAN-77 eingesetzt. Um die Moglich- 
keiten der Hardwarearchitektur, also die SIMD-Vektorverarbeitung und die MIMD- 
Verarbeitung, voll nutzen zu konnen, wurden Spracherweiterungen vorgenom- 
men. 244 

Eine Unterscheidung des initialen Prozesses von den anderen Prozessen erfolgt mit 
Hilfe der TASK PROGRAM- Anweisung. Jeder Prozefi besitzt eine Identitat in Form 
eines Wertes vom Datentyp TASKID. Der initiale Prozefi kann diesen Wert mit 
MASTERO abfragen, die anderen Prozesse mit MYTASKIDO. Ein neuer ProzeE wird 
durch die NEWTASK- Anweisung erzeugt. Der Nachrichtenaustausch erfolgt iiber 
die SEND- und RECEIVE-Anweisung. Bei der SEND- Anweisung handelt es sich um 
ein nichtblockierendes SEND . Nachdem der sendende Prozefi seine Nachricht 
abgeschickt hat, kann er sofort die nachste Anweisung ausfiihren. Der Empfang der 
Nachricht beim Zielprozefi mufi nicht abgewartet werden. Die RECEIVE-Anweisung 
dagegen wirkt blockierend. Ein Prozefi kann erst dann in der Programmausfuhrung 
fortfahren, wenn die gewiinschte Nachricht eintrifft. 245 

6.3.3. Beschreibung der speziellen Implementation 

Die Implementation fiir den SUPRENUM-Rechner ist gepragt durch das 
SUPRENUM-Programmiermodell. Gegeniiber der Implementation auf dem PC -LAN 
ergeben sich deshalb Unterschiede. 

Der Anmeldevorgang gestaltet sich grundsatzlich anders. Der Anwender startet vom 
Front-End-Rechner aus das Master-Programm und gibt die Anzahl der gewiinschten 
Slaves an. Das Starten der Slaves ubernimmt der Master, der gleichzeitig auch initia- 
ler Prozefi ist und durch das Statement INITIAL TASK PROGRAM PROGMAST als 
solcher gekennzeichnet ist. Hierbei ist PROGMAST der gewahlte Programmname 
fiir das Master-Programm. Um die Verbindung zwischen Master- und Slave-Pro- 
gramm herzustellen, beginnt das Master-Programm mit dem Statement TASK 
EXTERNAL PROGSLAV , wodurch dem Master-Programm der Name des zugehori- 
gen Slave-Programms mitgeteilt wird, und das Slave-Programm beginnt mit dem 
Statement TASK PROGRAM PROGSLAV , wodurch dieses Programm als Slave-Pro- 
gramm mit dem Namen PROGSLAV gekennzeichnet ist. 

Die Task-Kreierung erfolgt mit Hilfe der Funktion rtmult, die als Parameter den 
Namen des Slave-Programms, ein Feld mit den logischen Adressen der Prozesse, ein 



244 Die SIMD-Vektorverarbeitung wird durch die Array zuweisungen des FORTRAN-90 Proposals 
unterstiitzt; vgl. hierzu: Gemdt, M., Thole, C.-A., Trottenberg, U., Zima, H.P.: a.a.O., hier S. 250 

24 ^ Die Beschreibung der Softwarekomponenten findet sich z.B. in: Gerndt, M., Thole, C.-A., 
Trottenberg, U., Zima, H.P.: a.a.O., hier S. 249 f 
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Feld fur den Eintrag der physikalischen Adressen, die Anzahl der gewiinschten Pro- 
zesse und einen Fehlercode iibergibt. Die logischen Adressen werden den Prozessen 
im Master-Programm zugeordnet. Die Abbildung der einzelnen Prozesse auf die 
Prozessoren und damit die Zuteilung der physikalischen Adressen wird vom 
Betriebssystem durchgefiihrt. 

Im Gegensatz zur Implementation auf dem PC-LAN liest nicht jeder Prozeti die Ein- 
gabedaten ein, sondern zunachst liest der Master alle, auch die nur fur die Slaves 
relevanten Eingabedaten, und schickt anschliefiend die entsprechenden Daten an 
jeden Slave. 

Der Nachrichtenaustausch wird dadurch synchronisiert, dati das Empfangen einer 
Nachricht blockierend wirkt. Die Abstimmung zwischen einem SEND und einem 
RECEIVE erfolgt nicht fiber das Verschicken eines identifizierenden Strings am 
Anfang einer Nachricht, sondern iiber einen TAG. Auf der sendenden Seite wird 
jedem SEND ein TAG zugeordnet: 

SEND(TAG=1000,...) 

SEND(TAG=2000,...) 

Auf der empfangenden Seite existieren die RECEIVES mit dem entsprechenden TAG: 
RECEIVE(TAG=1000,...) 

RECEIVE(TAG=2000,...) 

Da das SEND nicht blockierend wirkt, kann eine zweite Nachricht unabhangig da- 
von abgeschickt werden, ob die als erstes geschickte Nachricht empfangen worden 
ist oder nicht. Das RECEIVE dagegen wirkt blockierend. Es kann erst im Programm 
fortgefahren werden, wenn eine Nachricht mit dem entsprechenden TAG gesendet 
worden ist. Ist die Reihenfolge, in der die Nachrichten gesendet werden, nicht fest 
vorgegeben, latit sich mit der Konstruktion 

IF (TESTTAG(WOO)) THEN 
RECEIVE(1000,...) 

ENDIF 

das blockierende RECEIVE aufheben. Wenn eine Nachricht mit dem TAG 1000 vor- 
liegt, wird sie empfangen, ansonsten wird im Programm weitergegangen. Dadurch 
dafi die Synchronisation vom Betriebssystem geregelt wird, ist keine explizite Pro- 
grammierung wie beim PC-LAN notwendig. Das gleiche gilt fur die Terminierung 
der Bearbeitung. Wenn der Master festgestellt hat, dafi die Bearbeitung beendet ist, 
terminiert er die gesamte Anwendung. 
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Da auf dem SUPRENUM-Rechner kein leistungsfahiger LP-Code zur Verfiigung 
stand, mufite hier ebenfalls auf die leistungsschwache Eigenentwicklung zuriick- 
gegriffen werden. Um dennoch eine moglichst hohe Leistungsfahigkeit zu erreichen, 
wurden Teile durch den Compiler oder nachtraglich durch manuellen Eingriff 
vektorisiert. Hierbei handelt es sich um 

- die Pivotzeilenbestimmung, 

- die Pivotspaltenbestimmung und 

- die Berechnung der neuen Basisinversen. 

Bei der Pivotzeilenbestimmung wird die aktuelle Basisinverse mit einer Spalte k der 
Ausgangsmatrix multipliziert. Hierbei ist sowohl eine zeilen- als auch eine 
spaltenweise Abarbeitungsreihenfolge mdglich. 246 
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Abbildung 30: Zeilenweise Matrix-V ektor-Multiplikation 

Zum einen lafit sich nacheinander jede Zeile der Basisinversen mit der gewiinschten 
Spalte der Ausgangsmatrix multiplizieren (vgl. hierzu Abbildung 30). Die andere 
Moglichkeit besteht darin, wie die Abbildung 31 zeigt, nacheinander jede Spalte der 
Basisinversen mit dem entsprechenden Element der gewiinschten Ausgangsspalte 
zu multiplizieren und auf die Summe der vorherigen Produkte zu addieren. Im 
Programm-Code werden hierzu die beiden Schleifen vertauscht. 



24 6 Schonauer, W.: Scientific Computing on Vector Computers, Amsterdam New York 1987, S. 146 
ff 
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Abbildung 3 1 : Spaltenweise Matrix-Vektor- Multiplikation 

Die Basisinverse ist als Matrix mit alien Nullelementen gespeichert. Die Ausgangs- 
matrix dagegen ist dicht gespeichert, d.h. es werden nur die Nichtnullelemente 
gespeichert und spaltenweise hintereinander in einem Vektor abgelegt. Mit Hilfe 
eines Vektors, der jeweils auf den Anfang einer Spalte innerhalb des Ausgangsvek- 
tors zeigt, und einem Vektor, der zu jedem Element des Ausgangsvektors die Zeile, 
in der dieses Element in der Ausgangsmatrix steht, angibt, wird der ordnungs- 
gemafie Zugriff auf die einzelnen Elemente des Ausgangsvektors gewahrleistet. 

Im Rahmen der oben beschriebenen Multiplikation werden bei der ersten Moglich- 
keit nur die Elemente des entsprechenden Teils des dicht gespeicherten Ausgangs- 
vektors mit den entsprechenden Elementen der Basisinversen multipliziert. Da die 
Ausgangsmatrix zumeist extrem diinn besetzt ist (unter 1%), ist eine grofie 
Geschwindigkeitssteigerung nicht zu erwarten. 

Anders verhalt es sich bei der zweiten Moglichkeit. Die Basisinverse ist nicht dicht 
gespeichert, so dafi bei einer Multiplikation und der darauffolgenden Addition die 
gesamte Vektorlange bearbeitet wird. Hierdurch ist im Gegensatz zur ersten Mog- 
lichkeit eine grofiere Geschwindigkeitssteigerung zu erwarten. Hinzukommt, dafi 
bei der zweiten Moglichkeit die Addition der einzelnen Produkte auch vektoriell 
erfolgt, wahrend bei der ersten Moglichkeit die Addition sequentiell durchgefiihrt 
wird. 247 



247 Selbst in dem Fall, wo auch die Basisinverse dicht gespeichert ist, ist die zweite Moglichkeit 
erfolgversprechender, da die Basisinverse sich im Laufe der Verarbeitung fiillt, so dafi bei einer 
Multiplikation und der darauffolgenden Addition im allgemeinen langere Vektoren bearbeitet 
werden konnen und demzufolge auch grofiere Geschwindigkeitssteigerungen zu erwarten sind. 
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Bei der Pivotspaltenbestimmung wird eine gewiinschte Zeile mit der gesamten 
Ausgangsmatrix multipliziert. Hierbei gibt es grundsatzlich wieder die beiden 
Moglichkeiten wie bei der Pivotzeilenbestimmung. Entweder wird nacheinander die 
gewiinschte Zeile der Basisinversen mit jeder Spalte der Ausgangsmatrix multipli- 
ziert oder aber es wird nacheinander jedes Element der gewiinschten Zeile der Basis- 
inversen mit dem entsprechenden Element aller Spalten der Ausgangsmatrix 
multipliziert und auf die Summe der vorherigen Produkte addiert. 

Die erste Moglichkeit lafit sich bei der gewahlten Speicherungsform realisieren, da 
die Multiplikation der Basisinversen mit einer Spalte der Ausgangsmatrix erfolgt. 
Die zweite Moglichkeit ist jedoch nur moglich, wenn eine Zeile vorliegt. Das bedeu- 
tet, dafi die Ausgangsmatrix zusatzlich zu der oben beschriebenen spaltenweisen 
Speicherungsform in einer ahnlichen zeilenweisen Speicherungsform vorliegen 
miifite. Da dieses nicht der Fall ist, mufi auf eine Geschwindigkeitssteigerung bei der 
Pivotspaltenbestimmung mit Hilfe der zweiten Moglichkeit verzichtet werden. 

Anders verhalt es sich wieder bei der Transformation der Basisinversen. Einerseits 
mufi hier eine Zeile berechnet werden, so dafi eine optimale vektorielle Bearbeitung 
gewahrleistet ist, und andererseits lafit sich die eigentliche Transformation der Basis- 
inversen voll vektorisieren, da jedes Element unabhangig von den anderen Elemen- 
ten der Basisinversen transformiert werden mufi. 




7. Anwendung des parallelisierten Verfahrens auf be- 
triebswirtschaftliche Planungsprobleme 

Im folgenden wird eine detaillierte Analyse des zeitlichen Losungsverhaltens der 
verschiedenen Modellformulier ungen sowie insbesondere der verschiedenen Ver- 
fahrens- und Parallelisierungsvarianten durchgefiihrt. 

Da einerseits im Zusammenhang mit der Parallelverarbeitung nur dann vergleich- 
bare Ergebnisse erzielt werden konnen, wenn die an der Bearbeitung beteiligten 
Rechner gleich leistungsstark sind, und andererseits die Untersuchung eines mog- 
lichst hohen Parallelisierungsgrades angestrebt wird, erfolgt zunachst eine Vorstel- 
lung der Ergebnisse beziiglich des Losungsverhaltens auf dem PC -LAN, wobei 
aufgrund ihrer hoheren Leistungsfahigkeit die 386-PCs fiir die Betrachtung herange- 
zogen werden. 

Des weiteren wird das zeitliche Losungsverhalten auf 3 vernetzten Spare-Work- 
station und 3 vernetzten RS/ 6000- Workstation untersucht, um zum einen aufzuzei- 
gen, inwieweit Abhangigkeiten von der zugrundeliegenden Hardware bestehen, 
und zum anderen auch Erfahrungswerte fiir das zeitliche Losungsverhalten auf 
gegeniiber den PCs wesentlich leistungsstarkeren Rechnem zu erhalten. 

Eine intensivere Betrachtung des zeitlichen Losungsverhaltens auf dem 
SUPRENUM-Rechner konnte aus finanziellen Griinden nicht durchgefiihrt werden. 
Es hat sich jedoch bei ersten Untersuchungen gezeigt, dafi bei einem Einsatz von 15, 
30 und 60 Prozessoren ein fast linearer Geschwindigkeitsanstieg zu erzielen war. 248 
Ferner war aufgrund des Bestrebens, ein Hdchstmafi an Portability zu erreichen, 
eine Implementation auf der Basis der PC-LAN-Anwendung ohne grofien Zeitauf- 
wand und konzeptionelle Programmumstellungen moglich. 

7.1. Betriebswirtschaftliche Planungsprobleme 

Es existieren eine Vielzahl von Planungsproblemen z.B. im Bereich der Produktions-, 
der Investitions- oder auch der Standortplanung, in denen Multiple-Choice-Situatio- 
nen auftreten und fiir deren Losung somit der im vierten Kapitel beschriebene 
Branch-and-Bound-Algorithmus herangezogen werden kann. Im folgenden werden 
stellvertretend zwei Problemstellungen der Produktionsplanung herangezogen. 



248 Schwartz, B.: Mixed-integer linear Optimization on a PC-Net, in: Grauer, M., Prefimar, D.B. 
(Hrsg.), Parallel Computing and Mathematical Optimization, Siegen, 1990, Proceedings, Berlin 
Heidelberg 1991, S. 45-63, hier S. 61 f 
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deren mathematische Abbildung mit Hilfe des im Kapitel 2 vorgestellten dynami- 
schen Produktionsplanungsmodells erfolgt. 

Da verlaBliche Aussagen beziiglic±i des Losungsverhaltens der Varianten, wenn 
iiberhaupt, nur in dem Fall moglich sind, wo sie bei unterschiedlichen Modelltypen 
und Modellgrofien ein ahnliches Verhalten aufweisen, wird im folgenden eine Pro- 
blemstellung mit offener Fertigungsweise, reihenfolgeunabhangigen Umriistkosten 
und -zeiten sowie einer unterschiedlichen Anzahl von Mikroperioden anhand der 
Modelle A3010301, A3010401 und A3010501 sowie eine Problemstellung mit ge- 
schlossener Fertigungsweise und reihenfolgeabhangigen Umriistkosten und -zeiten 
anhand des Modells A2210739 betrachtet. 

Die Modellnamen basieren auf folgender Namensgebung: 

1.-3. Stelle eigentlicher Modellname 

4. Stelle Anzahl Makroperioden 

5. -6. Stelle Anzahl Mikroperioden 

7.-8. Stelle Modelltyp 

Der wesentliche Unterschied hinsichtlich des Modelltyps entsteht hierbei durch die 
unterschiedlichen Fertigungsweisen, da die Abbildung der geschlossenen Ferti- 
gungsweise gegeniiber der Abbildung der offenen Fertigungsweise zusatzliche Ne- 
benbedingungen erforderlich macht 249 , die zu einer starken Einschrankung der An- 
zahl moglicher Losungen fiihren und damit zu einer Reduzierung der durch die 
kombinatorische Komponente gegebenen Grofie des Modells. 

Fiir alle vier Modelle existiert jeweils eine U/V- und eine V/Y-Formulierung. Wah- 
rend fiir die V/Y-Formulierung nur eine Untersuchung der einfachen Relaxation 
erfolgt, wird auf die U/V-Formulierung neben der einfachen auch die erweiterte 
Relaxation angewendet, um beziiglich des Zeitverhaltens der unterschiedlichen Re- 
laxationen Aussagen treffen zu konnen. 

Eine Ubersicht der verschiedenen Modellgrofien findet sich in der Tabelle 13. Fiir die 
Modellnamen wird dabei im folgenden eine Kurzschreibweise eingefiihrt, aus der 
das zugrundeliegende Modell, die Art der Modellformulierung und ggf. die Art der 
Relaxation hervorgeht, wie z.B. A303UV fiir das Modell A3010301 mit U/V-Formu- 
lierung und einfacher Relaxation oder A304UVR fiir das Modell A3010401 mit U/V- 
Formulierung und erweiterter Relaxation. 



249 Ygj hierzu Abschnitt 2.5.7.2. 
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Die genaue, den Modellen jeweils zugrundeliegende Problemstellung wird in den 
beiden folgenden Abschnitten beschrieben. 



Problem 


Var. 


Neb. 


kont. Var. 


binare 

Var. 


SOS 


Umfang 
der SOS 


A303UVR 


87 


55 


63 


24 


6 


4 


A303UV 


87 


76 


63 


24 


6 


4 


A303VY 


87 


92 


63 


24 


6 


4 


A304UVR 


116 


71 


84 


32 


8 


4 


A304UV 


116 


100 


84 


32 


8 


4 


A304VY 


116 


124 


84 


32 


8 


4 


A305UVR 


145 


87 


105 


40 


10 


4 


A305UV 


145 


124 


105 


40 


10 


4 


A305VY 


145 


156 


105 


40 


10 


4 


A227UVR 


251 


188 


187 


64 


16 


4 


A227UV 


251 


252 


187 


64 


16 


4 


A227VY 


251 


312 


187 


64 


16 


4 



Tabelle 13: Modellgrofien fur die Modelle A3010301, A3010401, A3010501 und 

A2210739 bei verschiedenen Modellformulierungen 

7.1.1. Die Modelle A3010301, A3010401 und A3010501 

Die Modelle A3010301, A3010401 und A3010501 weisen folgende Problemstellung 
auf: 

Zu bestimmen ist das gewinnmaximale Produktionsprogramm wahrend eines Pla- 
nungszeitraums von 160 ZE. Da sich in diesem Zeitraum die Umweltsituation nicht 
andert, ist nur eine Makroperiode zu betrachten, die beim Modell A30 10301 in ma- 
ximal 3, beim Modell A3010401 in maximal 4 und beim Modell A3010501 in maxi- 
mal 5 Mikroperioden unterteilt werden darf . 




187 



Es werden 3 Produkte in einem ein-, zwei- bzw. vierstufigen Produktionsprozefi bei 
offener Produktionsweise gefertigt. Hierzu stehen 2 Produktionsanlagen zur Verfii- 
gung. Da die verschiedenen Produktionsanlagen zwar jedes Produkt, jedoch nicht 
auf jeder Produktionsstufe fertigen konnen, ergeben sich Einschrankungen. Die 
Tabelle 14 zeigt die moglichen Zuordnungen Produktionsanlage-Produkt-Produk- 
tionsstufe. 

Bei einem Wechsel von einem Produkt und/oder einer Produktionsstufe auf ein an- 
deres Produkt und/oder eine andere Produktionsstufe fallen Umriistkosten und - 
zeiten an, die reihenfolgeunabhangig sind. 

In der Abbildung 32 finden sich fiir die drei Modelle die optimalen Maschinenbele- 
gungsplane. Es zeigt sich hierbei zum einen, wie unterschiedlich die Belegungen bei 
einer Variation der maximal moglichen Anzahl von Mikroperioden sind, und zum 
anderen, dafi eine Erhohung der Anzahl moglicher Mikroperioden von 3 auf 4 und 
von 4 auf 5 jeweils zu einer deutlichen Verbesserung des Zielfunktionswertes fiihrt. 



Produktionsanlage 


1 


2 


Produkt 1 Stufe 1 




X 


Produkt 1 Stufe 2 


X 




Produkt 2 Stufe 1 


X 


X 


Produkt 3 Stufe 1 


X 




Produkt 3 Stufe 2 




X 


Produkt 3 Stufe 3 




X 


Produkt 3 Stufe 4 


X 





Tabelle 14: Zuordnungen Produktionsanlage-Produkt-Produktionsstufe fiir die Modelle 

A3010301, A3010401 undA3010501 




Modell A3010301 




Perrode 



Produkt 

Stufe 



Produkt 

Stufe 



Modell A3010401 



Periode 

Ldnge 



Produkt 



Modell A 3010501 



Periode 

Lange 



Produkt 

Stufe 



Produkt 

Stufe 



Umrustzeit 



Abbildung 32 a-c: Gantt-Diagramme der Modelle A30103Q1, A30W401 und A3010507 
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7.1.2. Das Modell A2210739 

Dem Modell A2210739 liegt folgende Entscheidungssituation zugrunde: 

Es ist das gewinnmaximale Produktionsprogramm wahrend eines Planungszeit- 
raums von 20 ZE zu bestimmen. Auch hier mufi aufgrund unveranderter Umwelt- 
bedingungen nur eine Makroperiode betrachtet werden. Fur diese Makroperiode ist 
eine Unterteilung in 7 Mikroperioden vorgesehen. 

Es werden 4 Produkte auf 4 Produktionsanlagen in geschlossener Fertigungsweise 
gefertigt, wobei jedes Produkt nacheinander die gleichen 4 Produktionsstufen 
durchlauft. Die erste Produktionsstufe jedes Produktes kann hierbei von der ersten 
Produktionsanlage, die zweite Produktionsstufe von der zweiten, die dritte Produk- 
tionsstufe von der dritten und die vierte Produktionsstufe von der vierten Produkti- 
onsanlage ausgefiihrt werden. Da keine Anfangs- und Endlagerbestande fur 
Zwischenprodukte existieren, ergeben sich Einschrankungen fiir die in jeder Periode 
zu realisierenden Produktionsstufen. 

Fiir Produkt 1 bestehen Mindestabsatzmengen, fiir Produkt 3 Hochstabsatzmengen 
und von Produkt 4 mufi eine vorgegebene Menge produziert werden. 

Es miissen auch hier Umriistkosten und -zeiten beriicksichtigt werden, die im 
Gegensatz zu den Modellen A3010301, A3010401 und A3010501 reihenfolgeabhangig 
sind, allerdings in sehr eingeschranktem Mafie, da nur eine Reihenfolgeabhangigkeit 
beriicksichtigt werden mufi, wenn von der Fertigung des Produktes 2 auf der 
Produktionsstufe 4 auf die Fertigung des Produktes 3 ebenfalls auf der Produkti- 
onsstufe 4 umgeriistet werden mufi, wobei die reihenfolgeabhangigen Umriistkosten 
und -zeiten hoher sind als die als reihenfolgeunabhangig definierten Kosten und 
Zeiten. Ferner fallen keine Umriistzeiten und -kosten an, wenn auf den 
Produktionsanlagen 2, 3 und 4 mit der Fertigung begonnen wird. 

Den Maschinenbelegungsplan fiir das Modell A2210739 zeigt die Abbildung 33. 
Hierbei sind die erste, zweite und dritte Mikroperiode nicht proportional zu den 
anderen Mikroperioden 250 dargestellt, da sie im Verhaltnis zu diesen sehr kurz sind. 



250 Es wurde hier ein MaGstab von 1:3 im Verhaltnis zu den anderen Mikroperioden gewahlt. 
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Abbildung 33: Gantt-Diagramm des Modells A2210739 
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7.2. Sequentielle Verarbeitung 

Bevor das Losungsverhalten der vorgestellten Planungsprobleme beziiglich der pa- 
rallelen Verarbeitung analysiert wird, erfolgt zunachst eine Untersuchung der ver- 
schiedenen Verfahrensvarianten der sequentiellen Verarbeitung auf der Basis der 
PC-LAN-Implementation. 

7.2.1. Untersuchungskriterien der sequentiellen Verarbeitung 

Die Untersuchung der sequentiellen Verarbeitung gliedert sich in drei Teile. Zu- 
nachst erfolgt eine globale Betrachtung. In diesem Zusammenhang werden folgende 
Punkte geklart: 

1. Gesamtbearbeitungszeiten der verschiedenen Strategien 

2. Knotenanzahl der verschiedenen Strategien 

3. Anted der einzelnen Bearbeitungszeiten an der Gesamtbearbeitungszeit 

Als zweites wird eine Gegeniiberstellung der Gesamtbearbeitungszeiten ausgewahl- 
ter algorithmischer Varianten vorgenommen: 

4. best-first-Suche vs. kombinierte Tiefen- und best-first-Suche 

5. binare vs. mehrfache Verzweigung 

6. Teilungspunkt auf der Grundlage eines binaren SOS vs. Teilungspunkt auf der 
Grundlage eines kontinuierlichen SOS 251 

7. binare vs. kontinuierliche Gewichtung 252 

8. kombinierte Suche ohne geschatzte Zielfunktionswerte vs. kombinierte Suche 
mit geschatzten Zielfunktionswerten 

9. Pseudokosten vs. Kosten der Nichterfiillung 

10. Pseudokosten vs. Zusatz-Pseudokosten 

Die Abarbeitungsreihenfolge der SOS erfolgt hierbei grundsatzlich auf der Basis von 
Modellkoeffizienten, und zwar auf der Basis der T-Variablen. Aufierdem wird bei 
der Verzweigungsregel der Fall Binarbaum mit festem Teilungspunkt und bei den 
Pseudokosten der Fall einer wiederholten Berechnung nicht beriicksichtigt. 



2 ^1 Fur 'Teilungspunkt auf der Grundlage eines binaren SOS' wird im folgenden die Kurzbezeich- 
nung 'binarer SOS' und fur 'Teilungspunkt auf der Grundlage eines kontinuierlichen SOS' wird 
die Kurzbezeichnung 'kontinuierlicher SOS' verwendet; zur Definition binarer und 
kontinuierlicher SOS vgl. Abschnitt 4.2.1.. 

2 ^ 2 zur Definition binare und kontinuierliche Gewichtung vgl. Abschnitt 4.2.2. 1.2. 
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Es wird versucht, die unterschiedlichen Gesamtbearbeitungszeiten durch eine ge- 
nauere, vergleichende Betrachtung der Knotenanzahl sowie der Zeitaufwande fiir 
die wesentlichen Bearbeitungsschritte zu erklaren. Untersucht werden in diesem Zu- 
sammenhang fiir die best-first- und die kombinierte Suche ohne und mit geschatzten 
Zielfunktionswerten 

- die Zeit fiir die Bearbeitung eines Knotens bestehend aus 

- der Zeit fiir die LP-Optimierung, 

- ggf. der Zeit fiir die Bestimmung des nachsten Teilungspunktes, 

- der Zeit fiir die Bestimmung des nachsten zu bearbeitenden SOS, 

- ggf. der Zeit fiir die Berechnung der Pseudokosten oder Zusatz-Pseudokosten 
und 

- ggf. der Zeit fiir die Ermittlung der geschatzten Zielfunktionswerte, 
fiir die kombinierte Suche mit geschatzten Zielfunktionswerten ferner 

- die Zeit fiir die Uberarbeitung der geschatzten Zielfunktionswerte sowie 

fiir die kombinierte Suche mit geschatzten Zielfunktionswerten auf der Basis von 
Zusatz-Pseudokosten 

- die Zeit fiir das Einlesen der Eingabedaten bestehend aus 

- der Zeit fiir das Einlesen der LP- und der SOS-Eingabedaten, 

- der Zeit fiir die LP-Optimierung der kontinuier lichen Losung, 

- ggf. der Zeit fiir die Bestimmung des nachsten Teilungspunktes, 

- der Zeit fiir die Bestimmung des nachsten zu bearbeitenden SOS sowie 

- der Zeit fur die Schatzung des Zielfunktionswertes der kontinuierlichen Lo- 
sung. 

Da der Zeitaufwand 

- fiir das Bestimmen des nachsten zu bearbeitenden Knotens und 

- fiir die Uberarbeitung der Knotentabelle 

bei alien Verfahrensvarianten nur sehr gering ist und demzufolge auch nur sehr ge- 
ringe Unterschiede zwischen den einzelnen Varianten auftreten konnen, werden sie 
nicht beriicksichtigt. Ferner wird auch die Zeit fiir die Ausgabe der Knoteninforma- 
tion am Bildschirm nicht weiter analysiert, da sie fiir die Beurteilung des algorithmi- 
schen Verhaltens nicht von Bedeutung ist. 
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Fur die Gegenuberstellung werden jeweils die sich aus den unterschiedlichen Zeit- 
aufwanden ergebenden Differenzen betrachtet. Hierbei stellt sich bei der Knotenbe- 
arbeitungszeit das Problem, die Hohe der Zeitdifferenz zu ermitteln, die durch eine 
unterschiedliche Bearbeitungszeit pro Knoten verursacht wird, und die Hohe der 
Zeitdifferenz, die durch die unterschiedliche Knotenanzahl hervorgerufen wird. Die 
Bearbeitungszeit pro Knoten ergibt sich hierbei als Durchschnittswert aus der Kno- 
tenbearbeitungszeit fiir alle Knoten To und der Knotenanzahl K (durchschmttliche 
Knotenbearbeitungszeit) : 

to = ^ (7-1) 

K 

Fiir zwei Strategien A und B berechnet sich die Differenz ATo fiir die Knotenbearbei- 
tungszeit To wie folgt: 

ATo = To a -To b = to a * K a - to B * K b (7.2) 

Da sich sowohl die durchschnittliche Knotenbearbeitungszeit to als auch die Kno- 
tenanzahl K jeder Strategie jeweils als Summe aus der Grofie der anderen Strategic 
und der Differenz zwischen den beiden Strategien beziiglich dieser Grofie darstellen 
lafit, ergibt sich die folgende Gleichung: 

ATo = to A *K A ~[(to A + Ato)*(K A +AK)] = - to A * AK - Ato* K A (7.3) 

1. Summand 2. Summand 

Sie liefert die verursachungsgerechte Zuordnung der Differenzen. Der erste Sum- 
mand entspricht der durch die unterschiedliche Knotenanzahl hervorgerufenen 
Zeitdifferenz und der zweite Summand der durch die unterschiedliche durch- 
schnittliche Knotenbearbeitungszeit verursachten Zeitdifferenz. 

Neben einer verbalen Beschreibung der wesentlichen Sachverhalte erfolgt jeweils fiir 
ausgewahlte Beispiele eine Darstellung in Diagrammen, in denen die auftretenden 
Differenzen abgetragen werden. Da bei einem Vergleich Strategie A vs. Strategie B 
die Differenzen immer wie folgt gebildet werden: 

AT = T a — T b bzw. AK = K A — K B 

bedeutet eine Differenz mit positivem Vorzeichen, dafi die Strategie A die hohere 
Bearbeitungszeit bzw. Knotenanzahl liefert, und eine Differenz mit negativem Vor- 
zeichen, dafi die Strategie B die hohere Bearbeitungszeit bzw. Knotenanzahl auf- 
weist. Fur die Beschriftung der Diagramme werden folgende Kurzbezeichnungen 
eingefiihrt: 
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UV U/V-Formulierung mit einfacher Relaxation 

UVR U/V-Formulierung mit erweiterter Relaxation 

VY V/Y-Formulierung 

bf best-first-Suche 

kb kombinierte Tiefen- und best-first-Suche 

Bv Binarverzweigung 

Mv Mehrfachverzweigung 

Pk Pseudokosten 

ZP Zusatz-Pseudokosten 

KN Kosten der Nichterfiillung 

bb binarer SOS, binare Gewichtung 

bk binarer SOS, kontinuierliche Gewichtung 

kk kontinuierlicher SOS, kontinuierliche Gewichtung 

Da nicht nur das algorithmische Verhalten in Abhangigkeit der gewahlten Verfah- 
rensvarianten von Interesse ist, sondern auch der Einflufi der verschiedenen Modell- 
formulierungen auf das algorithmische Verhalten, werden in einem dritten Schritt 
die verschiedenen Modellformulierungen hinsichtlich ihres Losungsverhaltens 
gegentibergestellt. 

7.2.2. Untersuchung des Losungsverhaltens bei sequentieller Verarbeitung 
7.2.2.I. Gesamtbearbeitungszeiten 

Im Zusammenhang mit der Betrachtung der Gesamtbearbeitungszeiten interessiert 
insbesondere, welche Verfahrensvariante die geringste und welche die hochste 
Gesamtbearbeitungszeit liefert. 

Beziiglich der geringsten Gesamtbearbeitungszeit zeigt sich keine einheitliche Ent- 
wicklung. Tendenziell liefert die best-first- oder die kombinierte Suche ohne ge- 
schatzte Zielfunktionswerte die geringste Gesamtbearbeitungszeit. 

Anders verhalt es sich dagegen hinsichtlich der hochsten Gesamtbearbeitungszeit. 
Sie wird mit einer Ausnahme durch die kombinierte Suche mit Pseudokosten und 
binarer Verzweigung erreicht, allerdings jeweils auf der Grundlage unterschiedli- 
cher Teilungspunkte und Gewichtungen. 
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Eine genaue Darstellung fur die verschiedenen Modellformulierungen findet sich in 
den Diagrammen 6 a-c und 7 a-c. 253 

7. 2.2.2. Knotenanzahl 

Die geringste Knotenanzahl weist unabhangig von der Modellformulierung und 
dem zugrunde gelegten Modell grundsatzlich die best-first-Suche mit binarer Ver- 
zweigung auf. 

Die hochste Knotenanzahl wird jeweils durch die kombinierte Suche auf der Basis 
von geschatzten Zielfunktionswerten erreicht. Beim Modell A3010401 ist im Falle der 
U/V-Formulierung die Knotenanzahl bei der kombinierten Suche mit Kosten der 
Nichterfiillung am hochsten. Bei der V/Y-Formulierung dagegen erreicht die kom- 
binierte Suche mit Zusatz-Pseudokosten die hochste Knotenanzahl. 

Beim Modell A2210739 liefert bei alien drei Modellformulierungen die kombinierte 
Suche mit Zusatz-Pseudokosten die hochste Knotenanzahl. 

Beziiglich der Knotenanzahl zeigt sich demnach bezogen auf die beiden untersuch- 
ten Modelle eine Uberlegenheit der best-first-Suche mit binarer Verzweigung, wah- 
rend die kombinierte Suche auf der Basis von geschatzten Zielfunktionswerten nicht 
immer die erhoffte Knoteneinsparung liefert, sondern ganz im Gegenteil zur hoch- 
sten Knotenanzahl fuhrt. 

Die Knotenanzahlen fur die beiden Modelle und verschiedenen Modellformulierun- 
gen zeigen ebenfalls die Diagramme 6 a-c und 7 a-c. 

7.2.2.3. Anteil der einzelnen Bearbeitungszeiten an der Gesamtbearbeitungszeit 

Bei der best-first- und der kombinierten Suche auf der Basis von Zielfunktionswer- 
ten muB keine Uberarbeitung geschatzter Zielfunktionswerte vorgenommen werden. 
Die Gesamtbearbeitungszeit besteht daher im wesentlichen aus der Bearbeitungszeit 
fur die insgesamt zu bearbeitenden Knoten. Diese erreicht je nach Modell und Stra- 
tegic einen Anteil zwischen 78 und 96% an der Gesamtbearbeitungszeit. 

Bei der kombinierten Suche mit Pseudokosten und Kosten der Nichterfiillung ver- 
ringert sich der Anteil der Bearbeitungszeit fur die einzelnen Knoten auf bis zu 54%, 
da hier die Zeit fur die Uberarbeitung der geschatzten Zielfunktionswerte beriick- 
sichtigt werden muB. Dafiir erreicht die Bearbeitungszeit fur die Uberarbeitung der 
geschatzten Zielfunktionswerte einen Anteil zwischen 5 und 34%. 



253 Qj e Numerierung der Diagramme erfolgt jeweils links oben mit a beginnend von links nach 
rechts und von oben nach unten. Als Zeiteinheit wird in alien Diagrammen [sec] gewahlt. 
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Modell A304UV 




500 
450 
400 K 
350 n 
300 0 
250 ° 
200 1 
150 e 
100 n 
50 
0 



bk kk bk kk 



bk bk bk kk kk kk bk bk bk kk kk kk 



Modell A304UVR 




600 

500 K 

400 n 
o 

300 t 
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0 



Modell A304VY 




Bv Bv Bv Mv Bv Bv Bv Mv Bv Bv Bv Bv Bv Bv Bv Bv Bv Mv Mv Mv Mv Mv Mv 
bb bk kk bb bk kk bb bb bb bk bk bk kk kk kk bk bk bk kk kk kk 

1 1 i G esa mtbea rbe itu ngsz eit — 4 — Knots nanza hi 



Diagramm 6 a-c : Gesamtbearbeitungszeiten und Knotenanzahl Modell A3010401 





Diagramm 7 a-c: Gesamtbearbeitungszeiten und Knotenanzahl Modell A2210739 
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Bei der kombinierten Suche mit Zusatz-Pseudokosten fallt zwar, genau wie bei der 
best-first- und der kombinierten Suche auf der Basis von Zielfunktionswerten, keine 
Uberarbeitung geschatzter Zielfunktionswerte an, dafiir erfolgt jedoch eine Schat- 
zung des Zielfunktionswertes der kontinuierlichen Losung. Die Hohe des hierfiir 
benotigten Zeitaufwands ist stark abhangig von der Art der Verzweigung, so dafi 
auch der Anteil an der Gesamtbearbeitungszeit zwischen binarer und mehrfacher 
Verzweigung unterschiedlich ist. Bei binarer Verzweigung betragt er je nach Modell 
und Strategic zwischen 2 und 9% und bei mehrfacher Verzweigung zwischen 8 und 
16%. Entsprechend variiert auch der Anteil der Knotenbearbeitungszeit an der 
Gesamtbearbeitungszeit. Er erreicht bei binarer Verzweigung Werte zwischen 80 
und 90% und bei mehrfacher Verzweigung aufgrund des hoheren Anteils fiir die 
Schatzung des Zielfunktionswertes der kontinuierlichen Losung Werte zwischen 75 
und 85%. 

Die Zeit fiir das Bestimmen des nachsten zu bearbeitenden Knotens und die Zeit fiir 
die Uberarbeitung der Knotentabelle sind gemessen an der Gesamtbearbeitungszeit 
bei alien Strategien vernachlassigbar gering und haben somit keinen EinfluB auf die 
Hohe der Gesamtbearbeitungszeit und auftretender Differenzen zwischen unter- 
schiedlichen Strategien. Ihr Anteil liegt bei keinem der betrachteten Falle iiber 0.5% 
und meistens sogar unter 0.1%. 



Modell A227UV 




Bv Bv Mv Bv Bv Mv Bv Bv Bv Bv Bv Bv Mv Mv Mv Mv Mv Mv 
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M Einlesen 
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Bikfcchirm 


beitung 


■ Uberarbeitung 


■ Uberarbeitung 






Knotentabelle 


geschatzte ZF- 
Werte 







Diagramm 8: Anteil der einzelnen Bearbeitungszeiten an der Gesamtbearbeitungszeit 
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7.2.2.4. Best-first- und kombinierte Suche 

Die Knotenanzahl ist unabhangig von der gewahlten Modeliformulierung, wie 
erwartet, grundsatzlich bei der best-first-Suche geringer als bei der kombinierten 
Suche. 

Im Hinblick auf die durchschnittliche Knotenbearbeitungszeit bestatigt sich, dafi sie 
bei der kombinierten Suche geringer als bei der best-first-Suche ist, und damit, dafi 
das Wiederaufsetzen bei der kombinierten Suche effizienter genutzt werden kann, 
und zwar insbesondere im Falle der Binarverzweigung. 

Dies fuhrt dazu, dafi zumindestens beim Modell A2210739 bei binarer Verzweigung 
in den meisten Fallen die Zeitersparnis durch die geringere durchschnittliche 
Knotenbearbeitungszeit hoher ist als der Mehraufwand durch die hohere Knoten- 
anzahl und demzufolge die kombinierte Suche die geringere Gesamtbearbeitungs- 
zeit liefert, wahrend bei mehrfacher Verzweigung die Zeitersparnis geringer als der 
Mehraufwand ist und folglich die best-first-Suche die geringere Gesamtbearbei- 
tungszeit aufweist. 

In den Diagrammen 9 a und b sind fur alle Modellformulierungen die Differenzen 
fiir die Modelle A3010401 und A2210739 dargestellt. 

7.2.2.5. Binar- und Mehrfachverzweigung 

Wahrend bei der U/V-Formulierung mit einfacher und erweiterter Relaxation so- 
wohl beim Modell A3010401 als auch beim Modell A2210739 in alien betrachteten 
Fallen die Binarverzweigung die geringere Knotenanzahl aufweist, ist dieses bei der 
V/Y-Formulierung nur beim Modell A3010401 gegeben. Beim Modell A2210739 
weist in drei Fallen die Mehrfachverzweigung die geringere Knotenzahl auf, und 
zwar bei der kombinierten Suche mit Pseudokosten und mit Zusatz-Pseudokosten. 

Die durchschnittliche Knotenbearbeitungszeit ist erwartungsgemafi durch das effizi- 
entere Wiederaufsetzen grundsatzlich bei der Mehrfachverzweigung geringer als bei 
der Binarverzweigung. 

Das gleiche gilt fast immer auch fur die Zeit zur Uberarbeitung der geschatzten 
Zielfunktionswerte. Beziiglich des Zeitaufwands fiir die Schatzung des Zielfunkti- 
onswertes der kontinuierlichen Losung bestatigt sich die Vermutung, dafi dieser bei 
der Mehrfachverzweigung hoher ist. 
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Diagramm 9 a,b: Vergleich best-first- und kombinierte Suche 

Im Falle der U/V-Formulierung mit einfacher Relaxation fuhrt bei beiden Modellen 
und im Falle der V/Y-Formulierung beim Modell A2210739 die Mehrfachverzwei- 
gung unabhangig von der betrachteten Strategic zu einer z.T. deutlich geringeren 
Gesamtbearbeitungszeit als die Binarverzweigung, da der mit der hoheren Knoten- 
anzahl und ggf. mit der Schatzung des Zielfunktionswertes der kontinuierlichen 
Losung verbundene zeitliche Mehraufwand geringer ist als die Zeitersparnis 
aufgrund der geringeren durchschnittlichen Knotenbearbeitungszeit und ggf. der 
geringeren Zeit fur die Uberarbeitung der geschatzten Zielfunktionswerte. 
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Im Gegensatz dazu zeigt sich in den anderen Fallen nur bei der best-first- und der 
kombinierten Suche ohne geschatzte Zielfunktionswerte eine eindeutige Tendenz. 
Hier ist im Falle der binaren Verzweigung die Zeitersparnis durch die niedrigere 
Knotenanzahl gegeniiber dem Mehraufwand aufgrund der hoheren durchschnittli- 
chen Knotenbearbeitungszeit grofier und bewirkt damit eine insgesamt geringere 
Gesamtbearbeitungszeit. Bei der kombinierten Suche mit geschatzten Zielfunktions- 
werten fiihrt der Einflul? der Zeit fur die Berechnung der Pseudokosten und ggf. der 
Zeit fur die Uberarbeitung der Knotentabelle dazu, dafi die Gesamtbearbeitungszeit 
je nach Art der zugrunde gelegten Kosten und der Modelle keine eindeutige Ent- 
wicklung zeigt. 

In den Diagrammen 10 a und b findet sich fur das Modell A2210739 mit U/V- 
Formulierung und einfacher Relaxation sowie mit V/Y-Formulierung ein Uberblick 
iiber die auftretenden Differenzen. 

7.2.2.6. Binarer und kontinuierlicher SOS 

Bei der best-first- und der kombinierten Suche ohne geschatzte Zielfunktionswerte 
weist sowohl das Modell A3010401 als auch das Modell A2210739 nur relativ 
geringe Differenzen auf. 

Anders verhalt es sich bei der kombinierten Suche mit geschatzten Zielfunktions- 
werten. Hier unterscheiden sich sowohl bei der U/V-Formulierung als auch bei der 
V/Y-Formulierung, wie die Diagramme 11 a und b zeigen, in den meisten Fallen die 
Knotenanzahl, die durchschnittliche Zeit fur die Bearbeitung eines Knotens und die 
Zeit fur die Uberarbeitung der geschatzten Zielfunktionswerte erheblich, wobei 
jedoch weder fur diese drei Grofien noch die Gesamtbearbeitungszeit globale 
Aussagen in Abhangigkeit von der Wahl des SOS getroffen werden konnen. 

Insgesamt zeigt sich also keine Tendenz, die zu einer Praferierung des Teilungs- 
punktes auf der Basis binarer oder kontinuierlicher SOS fiihrt. 

7. 2.2.7. Binare und kontinuierliche Gewichtung 

Die Art der Gewichtung ist nur im Zusammenhang mit der V/Y-Formulierung und 
binarer Verzweigung relevant. 

Beim Modell A3010401 ist die Knotenanzahl auf der Grundlage kontinuierlicher 
Gewichte bei alien Strategien niedriger als auf der Grundlage binarer Gewichte. 
Anders verhalt es sich beim Modell A2210739. Mit Ausnahme der kombinierten 
Suche mit Zusatz-Pseudokosten liefert hier die kontinuierliche Gewichtung eine 
hohere Knotenanzahl. 
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Diagramm 10 a,b: Vergleich Binar- und Mehrfachverzweigung 
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Diagramm 1 1 a,b: Vergleich binarer und kontinuierlicher SOS 

Die durchschnittliche Knotenbearbeitungszeit weist z.T. nicht zu vernachlassigende 
Differenzen zwischen der binaren und der kontinuierlichen Gewichtung auf, wobei 
sich jedoch keine eindeutige Entwicklung feststellen lafit. 

Die Zeit fur die Uberarbeitung der geschatzten Zielfunktionswerte ist beim Modell 
A3010401 bei beiden Arten der Kostenermittlung im Falle der kontinuierlic±ien Ge- 
wichtung deutlicdi geringer, wahrend sie beim Modell A2210739 bei der Berechnung 
von Pseudokosten nahezu keinen Unterschied aufweist und bei der Berechnung von 
Kosten der Nichterfiillung bei binarer Gewichtung geringer ist. 

Trotz dieser Unterschiede bei der durchschnittlichen Knotenbearbeitungszeit und 
der Zeit fur die Uberarbeitung der geschatzten Zielfunktionswerte zeigt die Gesamt- 
bearbeitungszeit, wie den Diagrammen 12 a und b zu entnehmen ist, die gleiche 
Entwicklung wie die Knotenanzahl. Beim Modell A3010401 ist die Gesamtbearbei- 
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tungszeit auf der Grundlage kontinuierlicher Gewichte bei alien Strategien niedriger 
als auf der Grundlage binarer Gewichte und beim Modell A2210739 nur im Falle der 
kombinierten Suche mit Zusatz-Pseudokosten. 




Diagramm 12 a,b: Vergleich bindre und kontinuierliche Gewichtung 

7.2.2.8. Zielfunktionswerte und geschatzte Zielfunktionswerte 

Die Berucksichtigung geschatzter Zielfunktionswerte fiihrt zwar in einigen Fallen, 
nicht aber, wie erhofft, in alien Fallen zu einer geringeren Knotenanzahl. 

Da allerdings selbst bei einer geringeren Knotenanzahl der insgesamt aufgrund der 
Schatzung von Zielfunktionswerten entstehende Mehraufwand fast immer hoher als 
etwaige Zeitersparnisse durch die geringere Knotenanzahl ist, fiihrt die Beriicksich- 
tigung von geschatzten Zielfunktionswerten bei alien drei Arten von Kosten statt zu 
einer deutlich geringeren zu einer z.T. erheblich hoheren Gesamtbearbeitungszeit. 
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Hierbei entsteht der grofite Anteil des Mehraufwands im Falle der Berechnung von 
Pseudokosten und Kosten der Nichterfiillung durc±i die Uberarbeitung der 
geschatzten Zielfunktionswerte. Bei der Berechnung von Zusatz-Pseudokosten dage- 
gen weist die Schatzung des Zielfunktionswertes einen ganz erheblichen Anteil am 
Mehraufwand auf, wobei im Falle der Mehrfachverzweigung den weitaus grofiten 
Anteil hieran die Schatzung des Zielfunktionswertes der kontinuierlichen Losung 
besitzt. 

In den Diagrammen 13 a und b findet sich fur das Modell A2210739 mit U/V-For- 
mulierung und einfacher Relaxation sowie mit V/Y-Formulierung eine Gegeniiber- 
stellung. 
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Diagramm 13 a,b: Vergleich kombinierte Suche ohne und mit geschatzten Zielfunktions- 
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7. 2.2.9. Pseudokosten und Kosten der Nichterfiillung 

Weder die Knotenanzahl noch die durchschnittliche Knotenbearbeitungszeit weisen 
eine eindeutige Tendenz auf. 

Anders verhalt es sich dagegen bei der Zeit fur die Uberarbeitung der geschatzten 
Zielfunktionswerte. Sie unterscheidet sich bei beiden Modellen bei binarer Verzwei- 
gung wesentlich starker voneinander als bei mehrfacher Verzweigung. Wahrend sie 
bei mehrfacher Verzweigung im Falle der Beriicksichtigung von Kosten der Nichter- 
fiillung sowohl geringfiigig hoher als auch geringfiigig niedriger als bei der Beriick- 
sichtigung von Pseudokosten ist, ist sie bei binarer Verzweigung deutlich geringer, 
so dafi die mit der Uberarbeitung der geschatzten Zielfunktionswerte verbundene 
Zeiterspamis gegeniiber der Beriicksichtigung von Pseudokosten derart grofi ist, daft 
bei der Beriicksichtigung von Kosten der Nichterfiillung weder ein eventueller 
Mehraufwand durch eine hohere Knotenanzahl noch eine eventuell hohere durch- 
schnittliche Knotenbearbeitungszeit zu einer insgesamt hoheren Gesamtbearbei- 
tungszeit fiihren kann. Die Hoffnung, durch die Berechnung von Pseudokosten eine 
geringere Gesamtbearbeitungszeit zu erreichen, bestatigt sich demnach nicht (vgl. 
hierzu die Diagramme 14 a und b). 

7.2.2.10. Pseudokosten und Zusatz-Pseudokosten 

Im Zusammenhang mit der Berechnung von Zusatz-Pseudokosten entsteht, wie 
erwartet, auf der einen Seite ein Mehraufwand durch die Berechnung der Zusatz- 
Pseudokosten fiir die kontinuierliche Losung und fiir die anderen Knoten des 
Branch-and-Bound-Baumes und auf der anderen Seite wird, insbesondere bei der 
Binarverzweigung, eine Zeiterspamis da durch verursacht, dafi keine Uberarbeitung 
der Knotentabelle mehr erforderlich ist. Diese Zeiterspamis ist, wie die Diagramme 
15 a und b zeigen, beim Modell A3010401 in den meisten Fallen wesentlich hoher als 
der mit der Berechnung der Zusatz-Pseudokosten verbundene Mehraufwand, so dafi 
die Gesamtbearbeitungszeit trotz eines eventuell noch bestehenden Mehraufwands 
durch eine entgegen der Hoffnung doch hohere Knotenanzahl insgesamt bei der 
kombinierten Suche mit Zusatz-Pseudokosten geringer als bei der kombinierten 
Suche mit Pseudokosten ist. Beim Modell A2210739 zeigt sich diese Entwicklung 
nicht so eindeutig. 
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Diagramm 14 a,b: Vergleich Pseudokosten und Kosten der Nichterfilllung 



7.2.2.11. Gegeniiberstellung der verschiedenen Modellformulierungen 

Die unterschiedlichen Modellformulierungen unterscheiden sich insbesondere im 
Hinblick auf die Knotenanzahl, die durchschnittliche Knotenbearbeitungszeit und 
die Gesamtbearbeitungszeit, wobei sich nicht immer eine fiir beide Modelle giiltige 
Aussage machen lafit. 
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Diagramm 15 a,b: Vergleich Pseudokosten und Zusatz-Pseudokosten 

Wie die Diagramme 16 a und b zeigen, iiberschneiden sich die Intervalle zwischen 
minimal und maximal erreichter Knotenanzahl der verschiedenen Verfahrensvarian- 
ten bei der U/V-Formulierung mit einfacher Relaxation (1), der U/V-Formulierung 
mit erweiterter Relaxation (2) und der V/Y-Formulierung (3), so dafi sich die Mo- 
dellformulierungen im Hinblick auf die Knotenanzahl nur schwer in eine Reihen- 
folge bringen lassen. 
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Diagramm 16 a,b: Knotenanzahl der verschiedenen Modellformulierungen 

Beim Modell A3010401 erscheint zwar die V/Y-Formulierung beziiglich der Knoten- 
anzahl am vorteilhaftesten zu sein. Fur die U/V-Formulierung mit einfacher und mit 
erweiterter Relaxation dagegen ist eine eindeutige Entscheidung nicht moglich. Die 
minimale Knotenanzahl ist bei der erweiterten Relaxation zwar geringer als bei der 
einfachen Relaxation, dafiir sind anschliefiend die Intervalle zwischen den Knoten- 
anzahlen grofier, so dafi die maximale Knotenanzahl bei der einfachen Relaxation 
niedriger ist. Im Gegensatz zum Modell A3010401 lafit sich beim Modell A2210739 
eher eine Aussage beziiglich der im Hinblick auf die Knotenanzahl schlechtesten 
Modellformulierung treffen. Da zwar die V/Y-Formulierung auf der einen Seite eine 
deutlich hohere minimale Knotenanzahl als die U/V-Formulierung mit erweiterter 
Relaxation und eine nur geringfiigig niedrigere als die U/V-Formulierung mit einfa- 
cher Relaxation aufweist und auf der anderen Seite die maximale Knotenanzahl aber 
am hochsten ist, ist sie beziiglich der Knotenanzahl beim Modell A2210739 als die 
schlechteste Modellformulierung anzusehen. Die beste Modellformulierung dagegen 
lafit sich nicht eindeutig bestimmen, da die minimale Knotenanzahl bei der U/V- 
Formulierung mit erweiterter Relaxation am geringsten ist, die Intervalle zwischen 
den einzelnen Verfahrensvarianten dann jedoch, genau wie beim Modell A3010401, 
wieder derart grofi sind, dafi die maximale Knotenanzahl bei der einfachen Relaxa- 
tion geringer ist. 

Eine eindeutige Reihenfolge ergibt sich demgegeniiber fur die durchschnittliche 
Knotenbearbeitungszeit. Sie ist beim Modell A3010401 bei der U/V-Formulierung 
mit erweiterter Relaxation am geringsten, bei der V/Y-Formulierung etwa doppelt 
so hoch und bei der U/V-Formulierung mit einfacher Relaxation knapp dreimal so 
hoch wie bei der U/V-Formulierung mit erweiterter Relaxation. Beim Modell 
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A2210739 liefert die U/V-Formulierung mit erweiterter Relaxation ebenfalls die ge- 
ringste Knotenbearbeitungszeit, wahrend die V/Y-Formulierung eine fast doppelt 
und die U/V-Formulierung mit einfacher Relaxation eine etwas mehr als doppelt so 
hohe durchschnittliche Knotenbearbeitungszeit aufweist. Auffallig ist bei dieser Rei- 
henfolge, dafi die V/Y-Formulierung zu einer geringeren Knotenbearbeitungszeit als 
die U/V-Formulierung fiihrt, obwohl die V/Y-Formulierung eine hohere Anzahl 
von Nebenbedingungen als die U/V-Formulierung aufweist und von daher zu- 
nachst zu erwarten ware, da£ die Knotenbearbeitungszeit ebenfalls hoher ist. Dieser 
Sachverhalt lafit sich durch die geringere Grofie des durch die Umriistungsbedin- 
gungen aufgespannten Losungsraums der V/Y-Formulierung erklaren. 254 

Obwohl sich bezuglich der Knotenanzahl keine eindeutige Entwicklung bei der 
Modellformulierung gezeigt hat, ergibt sich fur die Gesamtbearbeitungszeit beim 
Modell A3010401 eine eindeutige Reihenfolge, da sich jeweils, wie den Diagrammen 
17 a und b zu entnehmen ist, die Intervalle zwischen geringster und hochster 
Gesamtbearbeitungszeit nicht oder nur wenig iiberschneiden. Insgesamt erweist sich 
demnach fur die betrachteten Falle die U/V-Formulierung mit erweiterter Relaxa- 
tion beim Modell A3010401 im Hinblick auf die Gesamtbearbeitungszeit als die beste 
und die U/V-Formulierung mit einfacher Relaxation als die schlechteste Modellfor- 
mulierung. 
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Diagramm 1 7 a,b: Gesamtbearbeitungszeiten der verschiedenen Modellformulierungen 
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Beim Modell A2210739 liefert die U/V-Formulierung im Falle der erweiterten Rela- 
xation ebenfalls wieder die geringste Gesamtbearbeitungszeit. Fiir die V/Y-Formu- 
lierung und die U/V-Formulierung mit einfacher Relaxation lafit sich jedoch nur 
bedingt eine Reihenfolge festlegen, da sich hier die Intervalle zwischen geringster 
und hochster Gesamtbearbeitungszeit stark iiberschneiden. Wird eine Beurteilung 
anhand der minimalen Gesamtbearbeitungszeit vorgenommen, so ist beim Modell 
A2210739, wie auch beim Modell A3010401, die U/V-Formulierung mit einfacher 
Relaxation hinsichtlich der Gesamtbearbeitungszeit als schlechter anzusehen als die 
V/Y-Formulierung. 

Insgesamt zeigt sich zwar, dafi der kompaktere Losungsraum der Umriistungsbe- 
dingungen bei der V/Y-Formulierung auch zu einer geringeren durchschnittlichen 
Knotenbearbeitungszeit fiihrt. Die Vermutung, dafi auch die Gesamtbearbeitungszeit 
gegeniiber der U/V-Formulierung mit einfacher Relaxation geringer ist, bestatigt 
sich jedoch nur eingeschrankt. 

Beziiglich der Art der gewahlten Relaxation hat sich ergeben, dafi auf der Basis der 
im vorliegenden Fall verwendeten LP-Software das Weglassen von Nebenbedin- 
gungen zu einer derartigen Zeitersparnis bei der Knotenbearbeitung fiihrt, dafi 
durch die erweiterte Relaxation eine deutlich geringere Gesamtbearbeitungszeit er- 
reicht werden kann. 

7.2.3. Zusammenfassung 

Wie erwartet, hat die Wahl der Relaxation und die Art der Modellformulierung 
einen entscheidenden Einflufi auf die Gesamtbearbeitungszeit. Hier hat sich die 
U/V-Formulierung mit erweiterter Relaxation als am besten erwiesen, wahrend die 
U/V-Formulierung mit einfacher Relaxation und die V/Y-Formulierung sich, zu- 
mindestens beim Modell A2210739, nicht mehr in eine eindeutige Reihenfolge brin- 
gen lassen. 

Hinsichtlich der verschiedenen Verfahrensvarianten hat sich ergeben, dafi die best- 
first-Suche erwartungsgemafi die geringste Knotenanzahl aufweist. Dafiir ist jedoch 
bei der kombinierten Suche die durchschnittliche Knotenbearbeitungszeit geringer. 
Die Beriicksichtigung von geschatzten Zielfunktionswerten fiihrt zwar in einigen, 
jedoch nicht in alien Fallen zu der erhofften Knotenreduzierung. Da allerdings der 
mit der Schatzung verbundene Mehraufwand hoher ist als eine eventuelle 
Zeitersparnis durch eine geringere Knotenanzahl, bringt die Beriicksichtigung von 
geschatzten Zielfunktionswerten nicht die erhoffte Reduzierung der 
Gesamtbearbeitungszeit, wobei die Schatzung von Zielfunktionswerten auf der Basis 
von Kosten der Nichterfiillung noch am vielversprechendsten erscheint. Zugunsten 
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der Schatzung von Zielfunktionswerten ist allerdings in diesem Zusammenhang zu 
bedenken, dafi aufgrund der im Kapitel 6 beschriebenen bestehenden 
Speicherbeschrankungen eine Vielzahl von Werten wiederholt berechnet werden 
miissen, die ohne diese Einschrankung nur einmal berechnet und dann gespeichert 
werden konnten. 

Beziiglich der Art der Verzweigung hat sich gezeigt, dafi zwar die Anzahl im 
schlechtesten Fall zu berechnender Knoten bei der Binarverzweigung hoher als bei 
der Mehrfachverzweigung ist, die Zahl der tatsachlich zu berechnenden Knoten 
allerdings trotzdem bei binarer Verzweigung geringer ist. Ferner bestatigt sich die 
Vermutung, dafi die durchschnittliche Knotenbearbeitungszeit bei mehrfacher Ver- 
zweigung geringer als bei binarer Verzweigung ist. Im Hinblick auf die Schatzung 
von Zielfunktionswerten ist der Zeitaufwand fur die Uberarbeitung der geschatzten 
Zielfunktionswerte bei mehrfacher Verzweigung geringer und fur die Schatzung des 
Zielfunktionswertes der kontinuierlichen Losung bei binarer Verzweigung. 

Die Wahl des SOS hat bei der best-first- und der kombinierten Suche ohne ge- 
schatzte Zielfunktionswerte so gut wie keinen Einflufi auf die verschiedenen Bear- 
beitungszeiten und die Knotenanzahl. Bei der kombinierten Suche mit geschatzten 
Zielfunktionswerten ergeben sich zwar durchaus Differenzen; ein einheitliches Ver- 
halten, das zu einer Praferierung einer der beiden Moglichkeiten fiihren wurde, 
zeichnet sich jedoch nicht ab. 

Hinsichtlich der Art der Gewichtung lassen sich ebenfalls keinerlei Tendenzen er- 
kennen. 

Zusammenfassend lafit sich demnach feststellen, dafi die Gesamtbearbeitungszeiten 
bei der best-first- und der kombinierten Suche ohne geschatzte Zielfunktionswerte 
am geringsten sind, wobei sich allerdings keine Verfahrensvariante zeigt, der grund- 
satzlich der Vorzug zu geben ist. 




213 



7.3. Parallele Verarbeitung 

7.3.1. Untersuchung des Losungsverhaltens 

Fiir die parallele Verarbeitung erfolgt zunachst anhand der Modelle A3010401 und 
A2210739 eine globale Betrachtung der Gesamtbearbeitungszeiten und der Knoten- 
anzahl sowie eine Gegenuberstellung der schon im Rahmen der sequentiellen Verar- 
beitung behandelten Untersuchungskriterien, wobei insbesondere untersucht wird, 
inwieweit Unterschiede im Losungsverhalten zwischen der sequentiellen und der 
parallelen Verarbeitung bestehen. Auf eine detaillierte Darstellung des Vergleichs 

- binarer vs. kontinuierlicher SOS und 

- binare vs. kontinuierliche Gewichtung 

wird allerdings verzichtet, da sich einerseits, genau wie auch bei der sequentiellen 
Verarbeitung, entweder keine groBen Unterschiede ergeben oder sich bei der paral- 
lelen Verarbeitung keine eindeutigen Tendenzen gezeigt haben und andererseits 
auch bei Unterschieden zwischen der sequentiellen und parallelen Verarbeitung 
keine eindeutigen Entwicklungen aufgetreten sind. 

Anschliefiend werden durch eine Gegenuberstellung ausgewahlter Parallelisie- 
rungsvarianten nur die die parallele Verarbeitung betreffenden Aspekte untersucht. 

Die Messung der fiir die Untersuchung notwendigen Zeitaufwande der einzelnen 
Bearbeitungsschritte ist bei der parallelen Verarbeitung aufwendiger. Es sind hier 
sowohl Zeitmessungen auf der Seite der Slaves als auch auf der Seite des Masters 
vorzunehmen, und zwar auf seiten des Masters 

- die Zeit fiir das zur Verfiigungstellen des Namens der Eingabedatei, das Warten 
auf die Riickmeldung des ersten Slaves und das Uberarbeiten der Riickmeldung, 

- die Zeit fiir die Bestimmung des nachsten zu bearbeitenden Knotens, 

- die Zeit fiir die Auswahl eines Slaves und ggf. das zur Verfiigungstellen der 
Knoteninformation sowie 

- die Zeit fiir die Uberarbeitung der Knotentabelle 
und auf seiten der Slaves 

- die Zeit fiir das Auslesen des Namens der Eingabedatei, das Einlesen der Einga- 
bedaten sowie das Vorbereiten und zur Verfiigungstellen der Riickmeldung, 

- die Zeit fiir das Auslesen und Aufbereiten der Knoteninformation, 

- die Zeit fiir die Bestimmung des nachsten zu bearbeitenden Knotens, 
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- die Zeit fur die Knotenbearbeitung, 

- die Zeit fur die Uberarbeitung der Knotentabelle, 

- die Zeit fur das Vorbereiten und zur Verfugungstellen der Ergebnisse an den 
Master sowie 

- die Wartezeit zwischen dem zur Verfugungstellen einer Meldung und dem Erhalt 
der nachsten Meldung. 

In einem zweiten Untersuchungsschritt werden die Parallelisierungsvarianten im 
Hinblick auf den erreichbaren Speedup beurteilt. Auch hier wird zunachst eine glo- 
bale Betrachtung des von den verschiedenen Parallelisierungs- und Verfahrensvari- 
anten erreichten Speedups durchgefuhrt, bevor eine genauere Analyse durch eine 
Gegeniiberstellung ausgewahlter Varianten vorgenommen wird. 

Da der bei der parallelen Verarbeitung erreichte Speedup in der Regel mit einer 
zunehmenden Anzahl von Prozessen nicht linear ansteigt, wird als drittes der 
hierfiir verantwortliche Overhead untersucht. 

Sowohl bei der Speedup- als auch bei der Overhead-Betrachtung werden zunachst 
die Modelle A3010401 und A2210739 fur die Untersuchung herangezogen und an- 
schliefiend noch eine vergleichende Betrachtung zwischen diesen beiden Modellen 
und den Modellen A30 10301 und A30 10501 durchgefuhrt, um zum einen die zuvor 
erhaltenen Ergebnisse zu verifizieren und zum anderen eventuelle Abhangigkeiten 
von der Problemgrofie aufzuzeigen. 

Im Anschlufi an die Untersuchung der Bearbeitungszeiten, der Knotenanzahl, des 
Speedups und des Overheads wird uberpriift, inwieweit die auf den stark vereinfa- 
chenden Annahmen beruhenden Analysemodelle eine gute Abbildung des tatsachli- 
chen Verhaltens darstellen und inwieweit eine Vorhersage der Gesamtbearbeitungs- 
zeiten bei einer unterschiedlichen Anzahl von Prozessen moglich ist, wertn als 
Berechnungsgrundlage fur die Schatzwerte die Einzelbearbeitungszeiten der 
sequentiellen Verarbeitung herangezogen werden. 

7.3.I.I. Gesamtbearbeitungszeiten 

Geringe Gesamtbearbeitungszeiten werden von den Varianten II, III und Ha erreicht, 
wobei die geringste Gesamtbearbeitungszeit beim Einsatz von 3 Prozessen die Paral- 
lelisierungsvariante Ha liefert und beim Einsatz von 6 und 9 Prozessen dagegen die 
Varianten II oder III, und zwar in den meisten Fallen durch die Mehrfachverzwei- 
gung. 
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Die hochste Gesamtbearbeitungszeit weist in der Regel unabhangig von der Anzahl 
der eingesetzten Prozesse die Parallelisierungsvariante III mit Zusatz-Pseudokosten 
auf. 

In den Diagrammen 18 a-c finden sich beispielhaft fiir das Modell A2210739 die 
Gesamtbearbeitungszeiten der verschiedenen Parallelisierungs- und Verfahrensvari- 
anten. 

7.3.1.2. Knotenanzahl 

Geringe Knotenanzahlen liefern die Parallelisierungsvarianten I und la. Wahrend 
bei der U/V-Formulierung mit erweiterter Relaxation die geringste Knotenanzahl 
grundsatzlich bei binarer Verzweigung erzielt wird, ist bei der U/V-Formulierung 
mit einfacher Relaxation bei beiden Modellen beim Einsatz von 3 Prozessen die 
Knotenanzahl im Falle der Binarverzweigung am geringsten und beim Einsatz von 6 
und 9 Prozessen dagegen im Falle der Mehrfachverzweigung. Bei der V/Y-Formu- 
lierung gilt dieses ebenfalls fur das Modell A2210739. Beim Modell A3010401 aller- 
dings fiihrt, genau wie bei der U/V-Formulierung mit erweiterter Relaxation, auch 
bei 6 und 9 Prozessen die Binarverzweigung zur geringsten Knotenanzahl. 

Hohe Knotenanzahlen weist die Parallelisierungsvariante III auf. Es zeigt sich jedoch 
keine Tendenz, bei welcher der verschiedenen Verfahrensvarianten die jeweils 
hochste Knotenanzahl erreicht wird. 

In den Diagrammen 19 a-c findet sich wieder beispielhaft fiir das Modell A2210739 
die Knotenanzahl der untersuchten Parallelisierungs- und Verfahrensvarianten. 

7.3.1.3. Auswirkungen der unterschiedlichen Verfahrensvarianten 

Hinsichtlich der Verfahrens variation hat sich beim Vergleich von binarer und 
mehrfacher Verzweigung zum einen gezeigt, dafi auch bei der parallelen Verarbei- 
tung die durchschnittliche Knotenbearbeitungszeit bei mehrfacher Verzweigung 
geringer ist, und zum anderen, dafi bzgl. der Knotenanzahl die Binarverzweigung 
nicht mehr so eindeutig die geringere Knotenanzahl liefert. Letzteres hat jedoch 
keinen entscheidenden Einflufi auf das Verhalten der Gesamtbearbeitungszeit, so 
dafi sich nennenswerte Unterschiede zwischen paralleler und sequentieller Verarbei- 
tung nicht zeigen. 
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Diagramm 18 a-c: Gesamtbearbeitungszeiten bei paralleler Verarbeitung 
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Diagramm 19 a-c: Knotenanzahl bei parallels Verarbeitung 
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Beziiglich der Berechnung von geschatzten Zielfunktionswerten ergeben sich gegen- 
iiber der sequentiellen Verarbeitung dadurch Verander ungen, daB bei der parallelen 
Verarbeitung zum einen keine Uberarbeitung der geschatzten Zielfunktionswerte 
mehr vorgenommen wird und zum anderen nicht jedem Slave alle schon berechne- 
ten Pseudokosten zur Verfiigung stehen. 

Hinsichtlich der Knotenanzahl lafit sich keine eindeutige Auswirkung der gegeniiber 
der sequentiellen Verarbeitung veranderten Vorgehensweise feststellen. Genau wie 
dort fiihrt auch bei der parallelen Verarbeitung die Beriicksichtigung geschatzter 
Zielfunktionswerte nicht grundsatzlich zu einer geringeren Knotenanzahl. 

Die Tatsache, daiS kein Austausch von Pseudokosten stattfindet, sondern jeder Slave 
die von ihm benotigten Pseudokosten selbst berechnen muB, fuhrt dazu, dafi die 
durchschnittliche Knotenbearbeitungszeit bei der Beriicksichtigung von geschatzten 
Zielfunktionswerten im Vergleich zur sequentiellen Verarbeitung noch hoher ist, 
und zwar insbesondere bei der Berechnung von Zusatz-Pseudokosten im Falle der 
Binarverzweigung. Ein deswegen zu erwartender Anstieg der Differenz mit zuneh- 
mender Anzahl von Prozessen zeigt sich jedoch nur beim Vergleich mit geschatzten 
Zielfunktionswerten auf der Basis von Zusatz-Pseudokosten im Falle binarer 
Verzweigung. 255 

Insgesamt erhoht sich die Gesamtbearbeitungszeit durch die Beriicksichtigung von 
geschatzten Zielfunktionswerten, obwohl die Zeit fur die Uberarbeitung der 
geschatzten Zielfunktionswerte nicht mehr anfallt. Im Falle der Berechnung von 
Zusatz-Pseudokosten steigt die Differenz mit zunehmender Anzahl von Prozessen 
derart stark an, dali die Gesamtbearbeitungszeit bei 9 Prozessen z.T. mehr als dop- 
pelt so hoch wie ohne geschatzte Zielfunktionswerte ist. 

7.3.I.4. Parallelisierungsvariante I und II 

Die Knotenanzahl ist bei mehrfacher Verzweigung bei Parallelisierungsvariante I bei 
3 Prozessen z.T. geringfiigig hoher als bei Parallelisierungsvariante II. Bei 6 und 9 
Prozessen dagegen ist sie bei Variante I deutlich geringer. Bei binarer Verzweigung 
zeigt sich keine derart eindeutige Tendenz. Hier ist die Knotenanzahl unabhangig 
von der Anzahl der eingesetzten Prozesse bei Parallelisierungsvariante I sowohl 
geringer als auch hoher als bei Parallelisierungsvariante II. 



255 j m F a u e d er Mehrfachverzweigung zeigt sich dieses nicht, da hier die meisten Zusatz-Pseudo- 
kosten schon durch die Berechnung des geschatzten Zielfunktionswertes der kontinuierlichen 
Losung am Anfang der Bearbeitung berechnet werden. 
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Diagramm 20 a,b: Vergleich Variante I und II bei 3 und 9 Prozessen 

Im Gegensatz zur Knotenanzahl ist die durchschnittliche Knotenbearbeitungszeit bis 
auf wenige Ausnahmen, wie erwartet, bei Parallelisierungsvariante II aufgrund der 
besseren Wiederaufsetzmoglichkeit geringer als bei Parallelisierungsvariante I, 
wobei die Differenz in den meisten Fallen mit zunehmender Anzahl von Prozessen 
steigt. 

Die Wartezeit ist im Falle der Mehrfachverzweigung grundsatzlich bei der Paralleli- 
sierungsvariante II geringer als bei Parallelisierungsvariante I. Im Falle der Binar- 
verzweigung liefer t bei 3 Prozessen Parallelisierungsvariante II ebenfalls wieder die 
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geringere Wartezeit, wahrend bei 6 und 9 Prozessen Parallelisierungsvariante I die 
geringere Wartezeit aufweist. 

Die Gesamtbearbeitungszeit ist beim Modell A2210739 in alien betrachteten Fallen 
bei der Parallelisierungsvariante II geringer als bei der Variante I, da die Zeiter- 
sparnis durch die geringere durchschnittliche Knotenbearbeitungszeit bei Paralleli- 
sierungsvariante II grundsatzlich hoher ist als der zeitliche Mehraufwand durch eine 
eventuell hohere Knotenanzahl. Bei dem Modell A3010401 gilt dieses uneinge- 
schrankt nur fiir die Mehrfachverzweigung. Bei der binaren Verzweigung liefert in 
einigen Fallen auch Parallelisierungsvariante I die geringere Gesamtbearbeitungs- 
zeit. 

7.3.I.5. Parallelisierungsvariante II und III 

Die Knotenanzahl ist bei Parallelisierungsvariante II geringer als bei Parallelisie- 
rungsvariante III. Damit zeigt sich, dafi auch hier, genau wie bei der sequentiellen 
Verarbeitung, die best-first-Suche zu einer geringeren Knotenanzahl als die kombi- 
nierte Suche fuhrt. 

Fiir die durchschnittliche Knotenbearbeitungszeit bestatigt sich zum einen, dafi diese 
bei Parallelisierungsvariante III aufgrund der effizienteren Wiederaufsetzmoglich- 
keiten geringer als bei Parallelisierungsvariante II ist, und zum anderen, daP der 
Unterschied im Falle der Binarverzweigung hoher als im Falle der Mehrfachver- 
zweigung ist. 

Die Wartezeit ist bei Parallelisierungsvariante III geringer als bei Parallelisierungs- 
variante II, wobei die Differenz insbesondere beim Modell A2210739 bei der Mehr- 
fachverzweigung nicht so hoch wie bei der Binarverzweigung ist und sowohl bei 
binarer als auch bei mehrfacher Verzweigung mit zunehmender Anzahl von einge- 
setzten Prozessen abnimmt. 

Insgesamt zeigt sich bei der parallelen Verarbeitung zumindestens fiir die Binarver- 
zweigung eine noch eindeutigere Tendenz beziiglich der Gesamtbearbeitungszeit als 
bei der sequentiellen Verarbeitung. Sie ist hier bis auf eine Ausnahme unabhangig 
vom betrachteten Modell und der Anzahl eingesetzter Prozesse bei Parallelisie- 
rungsvariante III geringer als bei Parallelisierungsvariante II. Bei der Mehrfachver- 
zweigung tritt auch haufiger der umgekehrte Fall auf. 





Diagramm 21 a,b: Vergleich Parallelisierungsvariante II und III bei 3 und 9 Prozessen 



7.3.I.6. Parallelisierungsvariante I und la sowie II und Ha 

Die Mitarbeit des Masters fiihrt zwar z.T. zu einer hoheren Knotenanzahl bei den 
Parallelisierungsvarianten la bzw. Ha, aber dennoch ist die Zeit fur die Knotenbear- 
beitung unabhangig von der Anzahl eingesetzter Prozesse bei Parallelisierungsvari- 
ante la bzw. Ha geringer als bei Parallelisierungsvariante I bzw. II, wobei die Diffe- 
renz bei der Binarverzweigung hoher als bei der Mehrfachverzweigung ist. 

Auf der anderen Seite fiihrt die Mitarbeit des Masters jedoch zu einer deutlich hohe- 
ren Wartezeit, und zwar insbesondere bei der Binarverzweigung. 
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Wahrend bei 3 Prozessen der Mehraufwand durch die hohere Wartezeit bei den 
Parallelisierungsvarianten la und Ha noch geringer ist als die Zeiterspamis durch die 
Knotenbearbeitung und damit die Varianten la und Ha die kiirzere Gesamtbearbei- 
tungszeit liefern, verhalt es sich bei 9 Prozessen umgekehrt (vgl. hierzu die Dia- 
gramme 22 a und b). Hier ist der Mehraufwand und folglich auch die Gesamtbear- 
beitungszeit bei den Varianten I und II geringer. Bei 6 Prozessen weisen in den 
meisten Fallen ebenfalls schon die Varianten I und II die geringere Gesamtbearbei- 
tungszeit auf. 



Model I A2210739 




Diagramm 22 a,b: Vergleich Parallelisierungsvariante I und la bzw. II und Ha bei 3 und 9 
Prozessen 
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7.3.I.7. Zusammenfassung 

Die Gegeniiberstellung der Parallelisierungsvarianten I, II und III hat gezeigt, dafi 
fast immer die Parallelisierungsvariante I die hochste durchschnittliche Knotenbear- 
beitungszeit und dafiir die geringste Knotenanzahl und die Parallelisierungsvariante 
III umgekehrt die geringste durchschnittliche Knotenbearbeitungszeit und dafiir die 
hochste Knotenanzahl aufweist. Nur in einigen wenigen Fallen ist bei Variante II die 
Knotenanzahl am geringsten und die durchschnittliche Knotenbearbeitungszeit am 
hochsten. 

Bei den Parallelisierungsvarianten I und II bewirkt die Mitarbeit des Masters eine 
hohere Knotenanzahl und eine deutlich hohere Wartezeit, wahrend die Knotenbear- 
beitungszeit insgesamt sinkt. 

Zusammenfassend lafit sich feststellen, dafi bei 3 Prozessen die Gesamtbearbeitungs- 
zeit grundsatzlich bei Parallelisierungsvariante Ha und bei 6 Prozessen zumeist und 
bei 9 Prozessen in jedem Fall bei Parallelisierungsvariante II oder III am geringsten 
ist. 

7.3.2. Speedup-Betrachtungen 

Als erstes werden die von den verschiedenen Parallelisierungsvarianten erreichten 
Speedups bei 3, 6 und 9 Prozessen gegeniibergestellt. Auf eine Untersuchung der 
Parallelisierungsvariante III mit geschatzten Zielfunktionswerten wird hierbei und 
auch in den folgenden Betrachtungen verzichtet, da sie sowohl bei der sequentiellen 
als auch bei der parallelen Verarbeitung nicht die erhoffte Reduzierung der Gesamt- 
bearbeitungszeit erbracht hat. Ferner werden aus Griinden der Ubersichtlichkeit 
lediglich Strategien auf der Grundlage kontinuierlicher SOS und kontinuierlicher 
Gewichte betrachtet. Diese Einschrankung erscheint legitim, da die Wahl des 
zugrunde gelegten SOS und die Art der Gewichtung bei den zu untersuchenden 
Parallelisierungsvarianten kaum die Hohe der Gesamtbearbeitungszeit und somit 
die Hohe des Speedups beeinflussen. 256 

Nach der globalen Betrachtung der Speedups wird eine Gegeniiberstellung des 
Speedups von binarer und mehrfacher Verzweigung vorgenommen, um den Einflufi 
der Verzweigungsart auf dessen Hohe zu bestimmen. 

Anschliefiend erfolgen jeweils fur die Binar- und die Mehrfachverzweigung 
Speedup-Vergleiche zwischen Parallelisierungsvariante I und II, la und Ila, II und 
III, I und la sowie II und Ila. 



256 pi e Zugrundelegung eines kontinuierlichen SOS und kontinuierlicher Gewichte wurde gewahlt, 
weil diese Konstellation in alien drei Modellformulierungen moglich ist. 
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7.3.2.1. Speedup 

Wie die Diagramme 23 a-c zeigen, ist der von den untersuchten Varianten jeweils 
erreichte Speedup stark abhangig von der Anzahl eingesetzter Prozesse. Bei 3 Pro- 
zessen liefert Parallelisierungsvariante Ila unabhangig von der Modellformulierung 
den hochsten und Parallelisierungsvariante I den niedrigsten Speedup. Bei 6 und 9 
Prozessen dagegen zeigt sich, dafi fiir die verschiedenen Modellformulierungen der 
hochste Speedup nicht mehr so eindeutig von einer Parallelisierungsvariante erreicht 
wird, sondern je nach Modellformulierung bei Parallelisierungsvariante II oder III 
am hochsten ist. Den geringsten Speedup weist hier Parallelisierungsvariante la auf. 

Um noch einen besseren Eindruck von der Differenz zwischen linearem und tat- 
sachlich erreichtem Speedup zu erhalten, wird im Diagramm 24 beispielhaft fur das 
Modell A2210739 mit U/V-Formulierung und einfacher Relaxation die durch die 
parallele Verarbeitung erreichte Effizienz dargestellt. Hierbei zeigt sich, dafi bei 3 
Prozessen maximal eine Effizienz zwischen 70 und 75% erreicht werden kann, und 
zwar, wie aufgrund des Speedups schon vorhersehbar, durch die Parallelisierungs- 
variante Ila, und dafi bei 6 und 9 Prozessen eine Effizienz von bis zu 85% moglich 
ist, wobei sie tendenziell bei den Varianten II und III am hochsten ist. Ferner steigt 
sie bei den Varianten I, II und III mit einer zunehmenden Anzahl von Prozessen 
zumeist an, wahrend sie bei den Varianten la und Ila in den meisten Fallen sinkt. 

7. 3.2.2. Binar- und Mehrfachverzweigung 

Bei Parallelisierungsvariante I und II liefert in alien betrachteten Fallen bei 6 und 9 
Prozessen die Mehrfachverzweigung einen hoheren Speedup als die Binarverzwei- 
gung, wobei die Differenz fast immer eine zunehmende Tendenz aufweist. Bei 3 
Prozessen ist der Speedup entweder nahezu gleich hoch oder aber ebenfalls bei der 
Mehrfachverzweigung hoher als bei der Binarverzweigung. 

Bei Parallelisierungsvariante III weist beim Modell A3010401 mit V/Y-Formulierung 
die Binarverzweigung einen hoheren Speedup als die Mehrfachverzweigung auf. In 
alien anderen Fallen dagegen ist bei 3 Prozessen der Speedup zwischen binarer und 
mehrfacher Verzweigung nahezu gleich hoch und bei 6 und 9 Prozessen, abgesehen 
von einer Ausnahme, ebenfalls wieder bei mehrfacher Verzweigung hoher als bei 
binarer Verzweigung und die Differenz bei einer zunehmenden Anzahl von Prozes- 
sen steigend. 




225 




Diagramm 23 a-c: Speedup bei 3, 6 und 9 Prozessen 
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Diagramm 24: Effizienz 



Bei den Parallelisierungsvarianten la und Ha zeigt sich bei 3 Prozessen keine ein- 
heitliche Entwicklung. Hier ist der Speedup bei binarer Verzweigung hdher, nahezu 
gleich hoch oder auc±i geringer als bei mehrfacher Verzweigung. Bei 6 und 9 Prozes- 
sen dagegen ist beim Modell A3010401 mit U/V-Formulierung der Speedup nahezu 
gleich hoch und ansonsten bestatigt sich auch hier wieder, dafi die mehrfache Ver- 
zweigung den hoheren Speedup liefert. 

7.3.2.3. Parallelisierungsvariante I und II sowie la und Ha 

Da fur die Berechnung des Speedups der Parallelisierungsvarianten I, II, la und Ha 
die gleiche Gesamtbearbeitungszeit der sequentiellen Verarbeitung zugrunde gelegt 
werden mufi, wird die Hohe des Speedups lediglich durch die Gesamtbearbeitungs- 
zeit der parallelen Verarbeitung beeinflufit, und zwar derart, dafi eine hohe Gesamt- 
bearbeitungszeit der parallelen Verarbeitung zu einem niedrigen Speedup fiihrt und 
umgekehrt eine niedrigere Gesamtbearbeitungszeit zu einem hohen Speedup. 

Demnach ist der Speedup von Parallelisierungsvariante II bzw. Ha bei der binaren 
Verzweigung beim Modell A2210739 unabhangig von der Modellformulierung in 
alien betrachteten Fallen und beim Modell A3010401 in einigen Fallen hoher als der 
Speedup bei Parallelisierungsvariante I bzw. Ia, und zwar jeweils mit zunehmender 
Tendenz. 






Diagramm 25 a-e: Speedup-V ergleich Biniir- und Mehrfachverzweigung Modell A227UV 






228 



Wie ein Vergleich der Diagramme 26 a und c mit den Diagrammen 26 b und d zeigt, 
liefert in jedem Fall Parallelisierungsvariante II bzw. Ha einen hoheren Speedup als 
Parallelisierungsvariante I bzw. Ia. Wahrend die Differenz bei dem Modell 
A3010401 mit U/V-Formulierung und erweiterter Relaxation sehr gering ist, steigt 
sie in den anderen Fallen, zumindestens von 6 nach 9 Prozessen, an. 



Binarverzweigung 



Mehrfachverzweigung 




Binarverzweigung 



Mehrfachverzweigung 




Prozesse 

| — linear -*-ia — lla 




— tin ear la 1 la 



Diagramm 26 a-d: Speedup-V ergleich Variante I und II bzw. Ia und 11a Modell A227UV 

7.3.2.4. Parallelisierungsvariante II und III 

Parallelisierungsvariante III liefert im Falle der Binarverzweigung beim Modell 
A2210739 bei alien drei Modellformulierungen sowie beim Modell A3010401 bei der 
V/Y-Formulierung unabhangig von der Anzahl eingesetzter Prozesse und bei der 
U/V-Formulierung teilweise einen hoheren Speedup. 
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Im Falle der Mehrfachverzweigung fiihrt beim Modell A3010401 nur die U/V-For- 
mulierung mit erweiterter Relaxation zu einem hoheren Speedup bei Parallelisie- 
rungsvariante III. Bei der einfachen Relaxation und der V/Y-Relaxation dagegen 
liefert Parallelisierungsvariante II den hoheren Speedup. Beim Modell A2210739 ist 
mit einer Ausnahme auch hier wieder bei alien drei Modellformulierungen unab- 
hangig von der Anzahl eingesetzter Prozesse der Speedup bei Parallelisierungsvari- 
ante III hoher als bei Parallelisierungsvariante II. 




Diagramm 21 a-d: Speedup-Vergleich Variante II und III 



7. 3.2.5. Parallelisierungsvariante I und la sowie II und Ha 

Auch hier werden wiederum lediglich Parallelisierungsvarianten betrachtet, fur 
deren Speedup-Berechnungen die gleiche Gesamtbearbeitungszeit der sequentiellen 
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Verarbeitung herangezogen werden mufi, so dafi die Hohe des Speedups nur durch 
die Gesamtbearbeitungszeit der parallelen Verarbeitung bestimmt wird. 

Da bei 3 Prozessen die Parallelisierungsvarianten la und Ha grundsatzlich die gerin- 
gere Gesamtbearbeitungszeit liefern, ist ihr Speedup hoher als bei den Parallelisie- 
rungsvarianten I und II. Bei 6 Prozessen verhalt es sich abgesehen von zwei Aus- 
nahmen genau umgekehrt und bei 9 Prozessen ist der Speedup in jedem Fall bei den 
Parallelisierungsvarianten I und II hoher als bei den Parallelisierungsvarianten la 
und Ha. 



Binarverzweigung 



Me hrfach verzweigu ng 




Prozesse 

— linear I la 




Binarverzwmgimg 



Me Krt ach verzwe i g u ng 




Prozesse 

| — linear II 1 la 




Diagramm 28 a-d: Speedup-Vergleich Variante I und la bzw. II und Ha Modell A227UV 





231 



7.3.2.6. Abhangigkeit von der Problemgrofie 

Um einerseits festzustellen, inwieweit die Ergebnisse der vorherigen Untersuchung 
bestatigt werden, und andererseits den Einflufi der Problemgrofie auf die Hohe des 
Speedups zu untersuchen, werden die jeweils von den Modellen A3010301, 
A3010401, A3010501 und A2210739 erreichten Speedups gegeniibergestellt. Als 
Modellformulierung wurde die V/Y-Formulierung gewahlt, und zwar mit der Ver- 
fahrensvariante binarer SOS und kontinuierliche Gewichtung. 

Da die Parallelisierungsvarianten la und Ha bei einer hoheren Anzahl eingesetzter 
Prozesse zu einem wesentlich geringeren Speedup fiihren als die entsprechenden 
Varianten I und II, werden im folgenden nur die Parallelisierungsvarianten I, II und 
III betrachtet, und zwar jeweils fur die binare und die mehrfache Verzweigung. In 
den Diagrammen 29 a-f findet sich fur die verschiedenen Varianten jeweils ein Ver- 
gleich der Speedups der betrachteten Modelle. 

Im Hinblick auf die Bestatigung der zuvor erhaltenen Resultate zeigt sich, dafi auch 
bei den Modellen A3010301 und A3010501 die Mehrfachverzweigung den hoheren 
Speedup liefert. Beim Vergleich Parallelisierungsvariante I und II dagegen bestatigt 
sich nur fur das Modell A3010501, dafi bei Parallelisierungsvariante II insbesondere 
im Falle einer mehrfachen Verzweigung der Speedup hoher ist. Beim Modell 
A3010301 dagegen verhalt es sich genau umgekehrt. Flier weist Parallelisierungsva- 
riante I den hoheren Speedup auf. Beziiglich des Vergleichs Parallelisierungsvari- 
ante II und III haben die Modelle A3010401 und A2210739 keine einheitliche Ent- 
wicklung geliefert. Die Modelle A3010301 und A3010501 dagegen zeigen beide 
einen hoheren Speedup bei Parallelisierungsvariante III. 

Hinsichtlich der Untersuchung des Einflusses der Problemgrofie zeigt sich fur die 
Parallelisierungsvarianten II und III bei binarer Verzweigung eine eindeutige Ten- 
denz. Hier liefert unabhangig von der Anzahl eingesetzter Prozesse grundsatzlich 
das Modell A3010501 den hochsten, das Modell A3010401 den zweithochsten, das 
Modell A2210739 den zweitniedrigsten und das Modell A3010301 mit Abstand den 
niedrigsten Speedup. 

Im Falle der Mehrfachverzweigung dagegen finden sich Uberschneidungen 
zwischen 3 und 6 Prozessen. So liefert z.B. bei Parallelisierungsvariante III das 
Modell A3010301 bei 3 Prozessen den zweithochsten Speedup, wahrend bei 6 Pro- 
zessen der Speedup im Vergleich zu den anderen Modellen am niedrigsten ist. Bei 9 
Prozessen bestatigt sich jedoch auch hier die bei der Binarverzweigung erhaltene 
Rangfolge. 




Variante I Binarverzweigung 



Variante I Mehrfachverzweigung 




Diagramm 29 a-f: Speedup-Vergleich unterschiedliche Modelle 
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Anders als bei den Parallelisierungsvarianten II und III lafit sich bei Parallelisie- 
rungsvariante I keine eindeutige Entwicklung des Speedups in Abhangigkeit vom 
Modell feststellen. Je nach Anzahl eingesetzter Prozesse schwankt der Speedup. So 
ist er z.B. bei Parallelisierungsvariante I und mehrfacher Verzweigung beim Modell 
A3010301 bei 3 Prozessen am zweitniedrigsten, bei 6 Prozessen am zweithochsten 
und bei 9 Prozessen am niedrigsten. 

Insgesamt tritt, wie auch schon bei den vorherigen Betrachtungen, ein Unterschied 
zwischen einerseits den Modellen A3010401, A3010501 und A2210739 und anderer- 
seits dem Modell A3010301 auf. 

7.3.3. Overhead-Betrachtungen 

7.3.3.I. Quantifizierung der Overheads 

In den Speedup-Gegeniiberstellungen spiegelt sich unmittelbar die unterschiedliche 
Entwicklung der Gesamtbearbeitungszeiten zwischen sequentieller und paralleler 
Verarbeitung wider. Es zeigt sich hierbei, daB in keinem der betrachteten Falle ein 
linearer Speedup erzielt werden konnte. 

Die Differenz zwischen der tatsachlichen und der theoretischen Gesamtbearbei- 
tungszeit, die sich ausgehend von der Gesamtbearbeitungszeit der sequentiellen 
Verarbeitung bei einem linearen Speedup ergeben wiirde, entspricht der Hohe des 
gesamten Overheads O ges . 

O ges =T(N)-^ (7.4) 

Da sich dieser gesamte Overhead aus der Summe unterschiedlicher einzelner Over- 
heads ergibt 257 , wird im folgenden versucht, eine moglichst genaue und verur- 
sachungsgerechte Berechnung der Hohe der einzelnen Overheads vorzunehmen. 
Hierbei muB zwischen der Berechnung fur die Parallelisierungsvarianten I, II und III 
einerseits und der Berechnung fur die Parallelisierungsvarianten la und Ha anderer- 
seits unterschieden werden. 



2 ^ 7 Eine Uberpriifung wird im Anhang A durchgefiihrt. 




